Gene Cag_0798 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cag_0798
Symbol
ID	3747452
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium chlorochromatii CaD3
Kingdom	Bacteria
Replicon accession	NC_007514
Strand	-
Start bp	1119712
End bp	1120875
Gene Length	1164 bp
Protein Length	387 aa
Translation table	11
GC content	48%
IMG OID	637773328
Product	aspartate aminotransferase
Protein accession	YP_379107
Protein GI	78188769
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0436] Aspartate/tyrosine/aromatic aminotransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCTTGC ACCTTAGTAA TCGCCACGCC TCAGTGCTGC AATCCGAAAT TCGTAGCATG 
TCCATAGCAT GTAGTCGTGT TAACGGCATT AATCTCGCTC AAGGTGTTTG CGATACTCCC 
GTGCCCAACG AGGTGCTGCA AGGTGCAAGC GAAGCTCTTC AGCAAGGGGT GAACACTTAT 
ACCCATTATG CAGGAATTAT TAGTTTACGC GAAGCTATTG CCGATAAGCA AGAACGTTTT 
TATGGTATTC GCTACCAGCC TGAATCAGAA ATTATTGTAA GTGCCGGTGC AACTGGTGCG 
CTATACGCAG CTTTTCAAGC ATTACTGAAT CCGGGCGATG AGGTAATTTT ATTTGAACCC 
TTTTATGGTT ACCACATAAC CACCTTGCAA GCGGCGGAAG CGGTGCCTCT CTATCTACCG 
TTAACGCTGC CGGAATGGAG CTTTAGTGAG CACGATCTTG AACAACTTGT TACACCACGT 
ACACGAGCCA TTATTGTTAA TACGCCTGCA AATCCCTCAG GAAAAGTCTT TTCATTAGCA 
GAAATGGAGC GTATTGCAGC CTTTGCCGAG CGTTACGACC TATTTGTTTT TACGGATGAA 
ATTTATGAAC ACTTTCTCTA CGAAGGGCAT CAACACCATA GTTTTGCCGC ATTGCCCGGC 
ATGAAAGAGC GCACCATAAC GGTGTCGGGG GCTTCAAAAA CCTTTAGCGT TACGGGATGG 
CGTATTGGAT ATGCCTTGTG CGACGCGCGT TGGGCGCAAG CTATCGGTTA CTTTAATGAC 
CTTGTCTATG TTTGTGCGCC AGCACCATTG CAAGCAGGGG TTGCGCGTGG TATGAGAGAA 
CTTGATGATC GTTTTTACAA CCATCTGTCG GTTGATTATC AAGCAAAGCG CGATCGCTTT 
TGTGCAACTT TAGCAAAAGC AGGGCTTGTT CCACACATTC CCGATGGTGC CTATTATGTG 
TTAGCCGACG TTTCAGCATT ACCCGGCAAT AGTGCTCACG AGCGAGCCAT GCACATTCTT 
AATCGCACAG GCGTGGCAAG CGTCCCGGGC AGCGCATTTT ATCAACATGG TAGAGGCGAT 
GGGTTAGTTC GTTTTTGCTA CGCCAAAGAG GATGCAATTT TAGAAGAGGC GTACCAACGT 
CTTGAGCGGT TGAGAGAGGG GTAA

Protein sequence

MSLHLSNRHA SVLQSEIRSM SIACSRVNGI NLAQGVCDTP VPNEVLQGAS EALQQGVNTY 
THYAGIISLR EAIADKQERF YGIRYQPESE IIVSAGATGA LYAAFQALLN PGDEVILFEP 
FYGYHITTLQ AAEAVPLYLP LTLPEWSFSE HDLEQLVTPR TRAIIVNTPA NPSGKVFSLA 
EMERIAAFAE RYDLFVFTDE IYEHFLYEGH QHHSFAALPG MKERTITVSG ASKTFSVTGW 
RIGYALCDAR WAQAIGYFND LVYVCAPAPL QAGVARGMRE LDDRFYNHLS VDYQAKRDRF 
CATLAKAGLV PHIPDGAYYV LADVSALPGN SAHERAMHIL NRTGVASVPG SAFYQHGRGD 
GLVRFCYAKE DAILEEAYQR LERLREG