Gene Cag_1440 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cag_1440
Symbol
ID	3746639
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium chlorochromatii CaD3
Kingdom	Bacteria
Replicon accession	NC_007514
Strand	+
Start bp	1907038
End bp	1908237
Gene Length	1200 bp
Protein Length	399 aa
Translation table	11
GC content	48%
IMG OID	637773975
Product	aspartate aminotransferase, putative
Protein accession	YP_379740
Protein GI	78189402
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0436] Aspartate/tyrosine/aromatic aminotransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCAGTTA CTGGAGAGCA ATACCTAACA CAGCGTGTGC TGGGAATGCA GGAATCGCAA 
ACCATACGCA TTACCAATCT TGCAGGTAAA ATGAAAGCCG AAGGACTTGA TATTGTCAGC 
CTTTCGGCAG GCGAGCCCGA TTTTCCAACG CCACAGCATG TGTGCGATGC GGGCATTGAA 
GCTATTCGCG CAGGCTTTAC GCGCTACACC GCAAACTCAG GTATCCCCGA CTTAAAAAAG 
GCTATTGTTG CCAAATTCAA ACGCGACAAT GGGCTTGAGT TTGCTGAAAA CCAAATTATA 
GTAAGCAACG GTGGCAAGCA AACGCTTGCC AACACCTTTC TTGCCCTTTG CGCCGAAGGT 
GATGAAGTAA TTGTGCCAGC TCCATTTTGG GTAAGCTTTC CTGAAATGGT GCGCCTTGCT 
GGTGGCACTC CGGTGATTGT TAATACCACC ATCGAAAGTG GCTACAAACT TACGCCCGAT 
CAGCTTGAGG CTGCAATTAC GCCAAAAACA AAAATGCTCG TGCTTAATTC ACCCTCAAAT 
CCAACGGGTT CCGTCTATAG CGAAGCCGAG GTTCGTGCGC TTATGGCAGT GCTTGAAGGA 
CGTAACATTT TTGTGCTCTC CGATGAAATG TACGACATGA TTGTGTACGA TAATGTTCGT 
CCATTTTCAC CAGCCTGCAT TCCTGCTATG AAGGATTGGG TGATTGTAAG TAACGGAGTT 
TCAAAAGCTT ACTCCATGAC GGGATGGCGC ATTGGCTACC TTGCAGGACC AAAATGGCTT 
ATTGACGCGT GCGATAAAAT TCAATCGCAA ACCACCTCCA ACCCCAACTC CATTGCTCAA 
AAAGCGGCTG TAGCAGCGCT TAATGGCGAT CAAAGCATGA TTGAAGAGCA TCGGTTAGAG 
TTCCAAAAAC GGCGCGATTA CATGTACGAA GCGCTTAACA AAATTCCGGG CTTTAAAACC 
ACCTTGCCAC AAGGTGCCTT TTATATTTTC CCTGATATTA GCGGTTTACT TGGTCGCACC 
TTTAACGGCG TTGAAATGAA GGATTCGGCT GATGTTGCAG AGTATTTGCT GAAAGTGCAT 
TACTTAGCCA CCGTGCCGGG CGATGCCTTT GGCGCTCCTG CAAACTTGCG TTTGTCGTAT 
GCTGCATCAA TTGCAGCGCT TGATGAAGCG TTAAATCGTT TGCGGAAGGC GTTTAGCTAA

Protein sequence

MAVTGEQYLT QRVLGMQESQ TIRITNLAGK MKAEGLDIVS LSAGEPDFPT PQHVCDAGIE 
AIRAGFTRYT ANSGIPDLKK AIVAKFKRDN GLEFAENQII VSNGGKQTLA NTFLALCAEG 
DEVIVPAPFW VSFPEMVRLA GGTPVIVNTT IESGYKLTPD QLEAAITPKT KMLVLNSPSN 
PTGSVYSEAE VRALMAVLEG RNIFVLSDEM YDMIVYDNVR PFSPACIPAM KDWVIVSNGV 
SKAYSMTGWR IGYLAGPKWL IDACDKIQSQ TTSNPNSIAQ KAAVAALNGD QSMIEEHRLE 
FQKRRDYMYE ALNKIPGFKT TLPQGAFYIF PDISGLLGRT FNGVEMKDSA DVAEYLLKVH 
YLATVPGDAF GAPANLRLSY AASIAALDEA LNRLRKAFS