Gene Clim_1803 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Clim_1803
Symbol
ID	6354632
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium limicola DSM 245
Kingdom	Bacteria
Replicon accession	NC_010803
Strand	+
Start bp	1980885
End bp	1982135
Gene Length	1251 bp
Protein Length	416 aa
Translation table	11
GC content	56%
IMG OID	642669406
Product	aminotransferase class I and II
Protein accession	YP_001943821
Protein GI	189347292
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0436] Aspartate/tyrosine/aromatic aminotransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	36
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCGGTAC AACCGAACAC CCCTGGAAAT CATGCCGCAA GACGTGTTCA GAACTACCAC 
TACGCAATTC TCAACCTCGC CGCTCTTGCA GAAGAGAGCG CTGCCGCCGG CAAACCGGTC 
ACCTCGCTCA ATATCGGCGA CCCGACCCTT TACGGATTCC ATCCGCCGCC CGCTCTTACC 
GAAGCCTGCA TTACGGCCCT CAGGGAAGGA TGCAACAGCT ATACATCGTC ATGCGGCATC 
GCCACAGCTC GCGAAGCGAT ATCGCACGAG GCCTCGGAAC GGCGGATCGC GACATCCGCA 
GAAGAGATCA TCATCACATC CGGAGCTACC GAGGCTGCCG ATCTTCTCTG TACGGCTATC 
CTGAATCCCG GCGATGAGGT ACTCTGCCCC TCTCCCGGTT ATCCGCTCTA CACCGCACTT 
GTCGCCCGAC AGGAGGCGGT AAGCGTACCA TACCGCCTCG ATCCAGGCAA CAACTGGCTT 
CCGGACCCGG AAGAGATCGA GCGGCTGATT ACCCCGAGAA CGAAACTGCT CATCGTCATC 
AACCCCAATA ACCCTACAGG CGCGCTCTAT CCTCCGGAAC TGCTCGCTTC GATCGCCGAA 
ACAGCCCGAC GAAACAATCT TGTCTGCCTT GCCGACGAGG TTTACCGGAA GCTGCTCTAC 
AGCGGCTCGC ACCATCCGTT CGCCTCTTTT GCCGGCAACG ACCTCCCGGT ATGCACGCTT 
GAGAGCCTTT CGAAAAATTT CATGGTTCCG GGATGGCGAA CCGGATGGAT GACCATGACC 
AACAGCCGCC TGATTCCCGA CATCCGCCGG GCGTTGCGGA AACTTGCCGA TGCGAGAGTC 
TGCGCTCCCG CTGCACCACA GTTCGCCATT CCCGAAGCGC TTTCGCTCGG AAATGACTAT 
CTTCTCCCTG TCCTTGAAAA ACTCAGGGTG CGTCGTGACC TCACCGTCAG GATGATCAAC 
GGTATCGAGG GACTCTCCTG CAGCAATCCC GAAGGGGCAT TCTACGTCAT GGCAAAACTC 
GATATGAGCC TCTATCCATT TGCCTCGGAT GAAGAATTTA TTGTTGAACT GCTCAGGAAA 
AAACGGATAT TGTTTGTTCA CGGTTCAGGA TTCGGCATGC AACCCCGTGA AGGATACTTC 
AGGATAGTTT ACCTGCCCGA TCCCCTTACG CTTGACATGG TTTACCATGA CCTGTACGAT 
TTTTTGCTCC ACTGCCGGCA CCACTCCGGC TCTATTCGTC AACAACTCTA A

Protein sequence

MPVQPNTPGN HAARRVQNYH YAILNLAALA EESAAAGKPV TSLNIGDPTL YGFHPPPALT 
EACITALREG CNSYTSSCGI ATAREAISHE ASERRIATSA EEIIITSGAT EAADLLCTAI 
LNPGDEVLCP SPGYPLYTAL VARQEAVSVP YRLDPGNNWL PDPEEIERLI TPRTKLLIVI 
NPNNPTGALY PPELLASIAE TARRNNLVCL ADEVYRKLLY SGSHHPFASF AGNDLPVCTL 
ESLSKNFMVP GWRTGWMTMT NSRLIPDIRR ALRKLADARV CAPAAPQFAI PEALSLGNDY 
LLPVLEKLRV RRDLTVRMIN GIEGLSCSNP EGAFYVMAKL DMSLYPFASD EEFIVELLRK 
KRILFVHGSG FGMQPREGYF RIVYLPDPLT LDMVYHDLYD FLLHCRHHSG SIRQQL