Gene PCC8801_1472 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PCC8801_1472
Symbol
ID	7103670
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cyanothece sp. PCC 8801
Kingdom	Bacteria
Replicon accession	NC_011726
Strand	-
Start bp	1544000
End bp	1545046
Gene Length	1047 bp
Protein Length	348 aa
Translation table	11
GC content	38%
IMG OID	643474547
Product	histidinol-phosphate aminotransferase
Protein accession	YP_002371684
Protein GI	218246313
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0079] Histidinol-phosphate/aromatic aminotransferase and cobyric acid decarboxylase
TIGRFAM ID	[TIGR01141] histidinol-phosphate aminotransferase

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTACCGA TTCGAGAATG CGTTAGCCAA ACCCCAGGAT ATGTCCCTGG AGAACAACCC 
CAAACCACGG ATTATATTAA ACTTAATACC AATGAAAACC CCTATCCTCC CCCTGATAAA 
ATTTTTGAGG GACTGCAACA AGAATTAACA AAAGTTAGAT TATATCCTGA TCCTGTTTCA 
ACTCAATTAA GGAAAGCTGC TGCTAATGTT TTTGGTATTT CCTATCAGAA TATTTTAGCA 
GGAAATGGCT CAGATGACAT TTTAAATATT GCAGTCAGAA CCTTTGTTAA TCCGGGGGAA 
GTTGTCGCTT TTCTCGATTT AACCTATTCC TTGTATGAGA CGATCGCACG GGTTCATGGT 
GCTTCTATTG TCCAAATTCC TACCAATAAT CAATTTGAAT TAAACGGACC GATTATTTGT 
CCTGAGGCTA AACTAATTTT TGTCGCTTCT CCTAATCCTC CTGTGGGAAA ACACCTGAAC 
CGAGACTATC TTGAAGAAAC CTGTAAACAG GCAACGGGAG TGGTATTAAT TGATGAAGCG 
TATGTGGATT TTAGCGATGA AAATCATCTA GACTTTTTAG AAAAATACGA CAATGTTATC 
ATTTCTCGTA CCATGTCTAA GAGTTATAGT TTAGCGGGAA TGCGAGTCGG TTTTGGGGTG 
AGTTCAACGG AAATTATTGA ACAAATGGAT AAGGTAAGAG ATTCCTATAA TTTAGATAGA 
ATCGCTCAAA CTTTAGGAAC AGCAGTATTA AATTATCAGG ACTATTTTAA AGGGGTTTGG 
CAACAAGTTC GTCACACCCG TACTCGGTTA ATTGAATCTT TGCGAACCTT AGAGTTTTTG 
GTGTTTGATT CTGATTCTAA TTTTGTGCTG GCATCTCCAC AATGGATAGC TGCATCGGAT 
CTTTATACAC AGTTAAAAGA GAGAAAAGTC CTAGTCAGAT ATTTTAGTCA TCCTCGCATT 
AAAGACTATG TTAGAATTTC CATTGGAACC GATCAAGAAA TTGATCGCTT ATTAGAAGCT 
ATCCATGAAA TTAAAGGGAG TAACTAA

Protein sequence

MLPIRECVSQ TPGYVPGEQP QTTDYIKLNT NENPYPPPDK IFEGLQQELT KVRLYPDPVS 
TQLRKAAANV FGISYQNILA GNGSDDILNI AVRTFVNPGE VVAFLDLTYS LYETIARVHG 
ASIVQIPTNN QFELNGPIIC PEAKLIFVAS PNPPVGKHLN RDYLEETCKQ ATGVVLIDEA 
YVDFSDENHL DFLEKYDNVI ISRTMSKSYS LAGMRVGFGV SSTEIIEQMD KVRDSYNLDR 
IAQTLGTAVL NYQDYFKGVW QQVRHTRTRL IESLRTLEFL VFDSDSNFVL ASPQWIAASD 
LYTQLKERKV LVRYFSHPRI KDYVRISIGT DQEIDRLLEA IHEIKGSN