Gene Clim_1203 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Clim_1203
Symbol
ID	6353720
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium limicola DSM 245
Kingdom	Bacteria
Replicon accession	NC_010803
Strand	+
Start bp	1297637
End bp	1298848
Gene Length	1212 bp
Protein Length	403 aa
Translation table	11
GC content	51%
IMG OID	642668819
Product	aspartate aminotransferase
Protein accession	YP_001943249
Protein GI	189346720
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0436] Aspartate/tyrosine/aromatic aminotransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.0124735
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTTGATG AAATCCAGTT TGATAAGATA AAGAGGCTTC CAAAGTACGT TTTCGCTGCC 
GTCAATGAGC TGAAAATGGC TGAGCGCAGG GCAGGAGAGG ATGTGATCGA TTTTTCGATG 
GGTAATCCTG ACGGTCCGAC TCCACAGCAT ATCGTTGACA AACTGGTGGA AAGCATAAAT 
AAACCGAGAA CCCACGGTTA TTCCGTGTCG AAGGGTATAT ACAAGCTGAG AGGTGCCGTA 
GGCAGCTGGT ACCGGCGGAA GTACAATGTC GATCTCGATC TTGATCGCGA AGTGGTTGTC 
ACCATGGGAT CCAAGGAGGG GTATGTCCAT CTTGTGCAGG CAATCACCAA TCCCGGAGAT 
CTGGCTATGG TGCCCGATCC CTGCTATCCG ATTCACTCAC AGGCGTTCAT TCTTGCCGGC 
GGCAATGTTC ACCGGTTGAA ACTGGAGATG CTCGAAGACT ACCGTCTCGA TGAAGATGCA 
TTTTTCAACA ATATCGAAAC CGCTCTCAGG GAGTCCTCTC CCAAGCCGAA ATACCTTGTG 
GTGAACTTTC CCAACAATCC CACCACGGCC ACGGTCGATA TCTCCTTTTA TGAACGTTTG 
GTTGAACTTG CCAGGAAAGA GCGCTTCTAC ATCATCAGTG ACATTGCCTA TGCCGAGATA 
ACCTTTGACG GCTATGTCAC GCCTTCCGTT CTTCAGGTTC CGGGAGCCAA GGATGTTGCC 
GTTGAAAGTT ACACCCTTTC GAAAACCTAC AACATGGCTG GCTGGAGAGT CGGGTTCATG 
GTCGGCAACG CCAAACTCAT CGGAGCCCTT GAAAAAATCA AGAGTTGGCT CGATTATGGC 
ACGTTTACGC CTATCCAGGT GGCGTCAACC ATTGCACTTA CCGACGATCA GAGCTGTGTT 
GCAGAGATAT GCGACGTTTA TCGCCGTCGT CGTGACGTGA TGATCAAAAG CTTCGATAAT 
GCCGGATGGC CGATACTGCC GCCGAGGGCA AGCATGTTCG TCTGGGCACG CATTCCCGAA 
CATCTCAGGA GCATGGGCAG TCTGGAATTC AGCAAGAAAC TGCTTACGGA AGGCAAGGTG 
GCGGTAAGTC CGGGTATCGG GTTTGGAGCA TATGGCGATG AATATGTTCG CGTCGCCATG 
ATTGAAAACG AAGAGCGTAT TCGTCAGGCC GCCAGAAATA TCAGGAAGTT CCTGAAAAAC 
AGCGAGTCCT GA

Protein sequence

MFDEIQFDKI KRLPKYVFAA VNELKMAERR AGEDVIDFSM GNPDGPTPQH IVDKLVESIN 
KPRTHGYSVS KGIYKLRGAV GSWYRRKYNV DLDLDREVVV TMGSKEGYVH LVQAITNPGD 
LAMVPDPCYP IHSQAFILAG GNVHRLKLEM LEDYRLDEDA FFNNIETALR ESSPKPKYLV 
VNFPNNPTTA TVDISFYERL VELARKERFY IISDIAYAEI TFDGYVTPSV LQVPGAKDVA 
VESYTLSKTY NMAGWRVGFM VGNAKLIGAL EKIKSWLDYG TFTPIQVAST IALTDDQSCV 
AEICDVYRRR RDVMIKSFDN AGWPILPPRA SMFVWARIPE HLRSMGSLEF SKKLLTEGKV 
AVSPGIGFGA YGDEYVRVAM IENEERIRQA ARNIRKFLKN SES