Gene Cag_1086 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cag_1086
Symbol
ID	3747953
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium chlorochromatii CaD3
Kingdom	Bacteria
Replicon accession	NC_007514
Strand	+
Start bp	1467990
End bp	1469081
Gene Length	1092 bp
Protein Length	363 aa
Translation table	11
GC content	46%
IMG OID	637773617
Product	histidinol-phosphate aminotransferase
Protein accession	YP_379391
Protein GI	78189053
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0079] Histidinol-phosphate/aromatic aminotransferase and cobyric acid decarboxylase
TIGRFAM ID	[TIGR01141] histidinol-phosphate aminotransferase

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	0.742726
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATACGC CTTATTCTAT AGAGCATTTA CTCAATCCCG CATTGCGCAA CATTGCTACC 
TACAAGGTGG AGGGTGGTCA GCAAGCTGAA ATTAAGCTGA ACCAAAATGA AAGTCCCTTT 
GATGTGCCGC AATGGCTTAA GGAGGAAATT ATTGGTGAGT TTATTCGGGA GCCATGGAAT 
CGCTACCCCG ATATTCTCCC TTATCGCGCC ATGGAGGCGT ATGCTAATTT TGTGGGGGTA 
CCTGCTGAGT GTGTGATAAT GAGCAATGGC TCCAATGAAA TGCTCTACAC TATTTTTCTT 
GCCTGCTTAG GACCAGGTAG AAAAGTGCTT ATTCCCAATC CCTCTTTTTC GCTCTATGAA 
AAACTTGCCC TGCTCTTGCA GTCGGATATT GTAGAGGTAC CTATGAAGAG TGATCTTTCG 
TTTGATGTTG AGGCTATTAT GAAGGCGGCG CACAATGAGG CGGTGGATGT GATTGTGCTC 
TCGAATCCCA ACAATCCCAC CTCCACCTCA ATGAGTTACG ATGCAGTCCG TAAGATTGCG 
GAGTCCACGC AAGCGTTGGT GTTAGTTGAT GAGGCGTATA TTGAGTTTTC GCGTGAGCGT 
TCAATGGTGG ATACTATTGA AGAATTACCT AATGTAGTGG TGTTGCGTAC CATGTCGAAA 
GCGCTTGCGC TTGCGGGTAT TCGTATTGGT TTTGCTCTTG CAAATGCGCC GTTGATGGCT 
GAAATTTCTA AACCAAAAAT TCCTTTTGCC TCAAGCCGTC TTGCTGAAAT TACCTTAATG 
AAGGTGCTTG CAAATTATCG TTTAGTAGAT GAAGCGGTTT CGGCTATTTT AAGCGAGCGC 
GATGCCTTGT ATGAGCAGTT GCGCATGATG GAGGGCGTTT CGCCGTTTGC CAGCGACACG 
AACTTTTTAA TTGTGCGAGT AGCCGATGCT AACGCTACCT TTAAGCGCCT TTACGATAAG 
GGAATTTTGG TACGCAATGT GTCGGGCTAT CACTTAATGG AGGGGTGTTT GCGCTGCAAT 
GTTGGTTTGC CTGAAGAGAA TCGCCGTTTA GCCGAGGCGT TTGCTGAGCT TTCAGTGGAA 
GTGAAAGGAT GA

Protein sequence

MNTPYSIEHL LNPALRNIAT YKVEGGQQAE IKLNQNESPF DVPQWLKEEI IGEFIREPWN 
RYPDILPYRA MEAYANFVGV PAECVIMSNG SNEMLYTIFL ACLGPGRKVL IPNPSFSLYE 
KLALLLQSDI VEVPMKSDLS FDVEAIMKAA HNEAVDVIVL SNPNNPTSTS MSYDAVRKIA 
ESTQALVLVD EAYIEFSRER SMVDTIEELP NVVVLRTMSK ALALAGIRIG FALANAPLMA 
EISKPKIPFA SSRLAEITLM KVLANYRLVD EAVSAILSER DALYEQLRMM EGVSPFASDT 
NFLIVRVADA NATFKRLYDK GILVRNVSGY HLMEGCLRCN VGLPEENRRL AEAFAELSVE 
VKG