Gene Haur_3156 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_3156
Symbol
ID	5735028
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	+
Start bp	3984425
End bp	3985717
Gene Length	1293 bp
Protein Length	430 aa
Translation table	11
GC content	50%
IMG OID	641280299
Product	aminotransferase class-III
Protein accession	YP_001545921
Protein GI	159899674
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0001] Glutamate-1-semialdehyde aminotransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.00000277167
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTGCAG CACAACTGCC CAAGGTCAGC GGCGAAGCCC TAAATCTCAC CAAATCGATG 
GAATTGTTAG TCCAAGCCGA AGCGATTGTT CCAGGAACAA CCCAATCGTT GATGAAACGG 
CCTGAGCAAT TTGCCTATGG TTCGTTTCCA GTTTTTATTG ATCATGGCGA TGGCGCGTTG 
GTAACCGATG TTGATGGCAA TCAATATATC GATTTTATTT GTGGCTTGGG TGCAACCACC 
TTGGGTCACA ACCATCTAGC AGTGGTCGAG GCAATTCGCA ATAACTTGGA TAAAGGGCTG 
ATTCATTCGC TGCCCACCGA AGTTGAGCTA CGCGCAACTC AAGCATTGAT CGATATTATT 
CCGAATGCTG AAATGGCTCG CTTCTTCAAA ACTGGGGCTG ATGCCACTTC GGCTGCTGTG 
CGTTTGGCTC GCCACCTGAC CAAGCGCGAA CGGATTATCA CGGTCGGCTA CAATGGTTGG 
CACGACCATT TTATGTATTA CACTCCTGGC GTGCCCGCAG TGCTCAGCCA ATACACCGAA 
CAAGTATCGT TGATGGCTCC CCACGAAAAG CCCAACTTGA TCGCTGCCAT CAACAACCAT 
GGCGATCAAT TGGCCGCCGT GTTGCTTTCA ATGCCCTACA AACACTGCTT GGATGCTGAG 
TATTTGAACG AAGTTAAGGC TGCTTGTCAT GCAGTTGGCG CATTATTTGT GCTCGATGAA 
GTGGTAACGG GCTTCCGCTT GGCGTTGGGT GGGGCGCAAG AATTCTATGG CGTTGATGCA 
GATTTCGTCT GTCTCTCAAA GGGCATCGCC GCAGGTATGC CACTTTCTGC GATTACTGGA 
CCCAAAAAGC ATCTCGAACG CTTATCCGAT TTGCAAGTTT CAACCACCTT TGGCGGCGAA 
ATGCTCTCGC TGGAAGTTTG CTACGAAGTG ATTAACATCT ATCGCAACAC TAACTATTTT 
GAGCATGTGG CCAAGCTTGG TCAACGCTTG CGTGAAGGCG TGAACGCCAA AGCTGAGGCG 
CTTGGAGTGG CATTGCGCGT CTGTGGCTAT GATGCAATTC CCTTCTTCTC CTTTGCACCT 
GATATGCCAA CCCATGCTCG TTTGATGGAA GCCTTGTTGG GCACATTGGC CAAACGTGGA 
GTCATTTTGC GTCGCGATGT CAACTTCTTG ACCAGCGCCC ATACAGTTGA GCAAATTGAT 
TTCACGATCG AGGCTGTCGC CCAAGGTTTA CAAGAATTGC TTGATCGCGG CATTATCGAA 
TCGACCAACG GCAAAGAACA AGCTGCTGGC TAA

Protein sequence

MSAAQLPKVS GEALNLTKSM ELLVQAEAIV PGTTQSLMKR PEQFAYGSFP VFIDHGDGAL 
VTDVDGNQYI DFICGLGATT LGHNHLAVVE AIRNNLDKGL IHSLPTEVEL RATQALIDII 
PNAEMARFFK TGADATSAAV RLARHLTKRE RIITVGYNGW HDHFMYYTPG VPAVLSQYTE 
QVSLMAPHEK PNLIAAINNH GDQLAAVLLS MPYKHCLDAE YLNEVKAACH AVGALFVLDE 
VVTGFRLALG GAQEFYGVDA DFVCLSKGIA AGMPLSAITG PKKHLERLSD LQVSTTFGGE 
MLSLEVCYEV INIYRNTNYF EHVAKLGQRL REGVNAKAEA LGVALRVCGY DAIPFFSFAP 
DMPTHARLME ALLGTLAKRG VILRRDVNFL TSAHTVEQID FTIEAVAQGL QELLDRGIIE 
STNGKEQAAG