Gene EcSMS35_0634 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_0634
Symbol	citF
ID	6147479
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	-
Start bp	647438
End bp	648970
Gene Length	1533 bp
Protein Length	510 aa
Translation table	11
GC content	56%
IMG OID	641615526
Product	citrate lyase, alpha subunit
Protein accession	YP_001742732
Protein GI	170683977
COG category	[C] Energy production and conversion
COG ID	[COG3051] Citrate lyase, alpha subunit
TIGRFAM ID	[TIGR01584] citrate lyase, alpha subunit

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	62
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGCAGA AAATTGAACA ATCTCAACGA CAAGAACGGG TAGCGGCCTG GAATCGTCGC 
GCTGAATGCG ATCTTGCCGC TTTCCAGAAC TCGCCAAAGC AAACCTACCA GGCTGAAAAA 
GCGCGCGATC GCAAACTGTG CGCCAACCTG GAAGAAGCGA TTCGTCGCTC TGGTTTACAG 
GACGGTATGA CGGTTTCCTT CCATCACGCT TTCCGTGGCG GTGACCTGAC CGTCAATATG 
GTGATGGACG TCATCGCGAA GATGGGCTTT AAAAACCTGA CTCTGGCCTC CAGCTCCCTG 
AGTGATTGCC ATGCGCCGCT GGTAGAACAC ATTCGCCGGG GCGTGGTTAC CCGCATTTAT 
ACCTCTGGCC TGCGCGGTCC ACTGGCGGAA GAAATCTCCC GTGGTCTGCT GGCGGAACCG 
GTGCAAATCC ACTCTCACGG CGGACGTGTG CATCTGGTAC AGAGCGGCGA ACTGAATATC 
GATGTGGCTT TCCTCGGCGT CCCGTCCTGT GATGAATTCG GTAATGCCAA CGGCTACTCC 
GGTAAAGCCT GCTGCGGCTC CCTCGGCTAT GCAATGGTTG ATGCCGACAA CGCAAAACAG 
GTCGTGATGC TTACCGAAGA ACTGCTGCCT TATCCGCATA ATCCGGCAAG CATTGAGCAA 
GATCAGGTTG ATCTGATCGT CAAAGTTGAT CGCGTTGGCG ATGCTGCAAA AATCGGCGCT 
GGTGCTACCC GTATGACCAC TAACCCGCGC GAACTGCTTA TTGCCCGTAG CGCTGCGGAT 
GTGATTGTTA ACTCTGGCTA CTTCAAAGAA GGTTTCTCCA TGCAGACCGG CACCGGCGGC 
GCTTCGCTGG CGGTAACCCG TTTCCTGGAA GACAAAATGC GTAGCCGCGA TATTCGCGCC 
GACTTCGCCC TCGGCGGTAT TACCGCAACG ATGGTTGATC TGCACGAAAA AGGTTTGATC 
CGCAAACTGC TGGATGTGCA GAGCTTTGAC AGCCACGCTG CGCAATCGCT GGCCCGTAAC 
CCCAATCACA TCGAAATCAG CGCCAACCAG TACGCTAACT GGGGTTCGAA AGGTGCATCG 
GTTGATCGTC TCGACGTGGT GGTACTGAGC GCGCTGGAAA TTGACACCCA GTTCAACGTT 
AACGTGCTGA CCGGCTCTGA CGGCGTACTG CGTGGCGCTT CCGGTGGTCA CTGCGATACC 
GCGATTGCCT CTGCACTTTC CATCATCGTC GCACCGCTGG TACGCGGTCG TATTCCGACT 
CTGGTGGATA ACGTGCTGAC CTGCATCACC CCGGGCTCCA GTGTCGATAT TCTGGTCACA 
GACCACGGTA TCGCAGTTAA CCCGGCACGT CCGGAACTGG CAGAACGTCT GCAGGAAGCG 
GGCATTAAAG TGGTTTCCAT TGAGTGGCTG CGTGAACGTG CGCGTCTGCT GACCGGTGAA 
CCACAGCCGA TTGAATTCAC CGACCGCGTC GTTGCCGTTG TGCGTTACCG CGATGGCTCG 
GTGATCGATG TTGTGCATCA GGTGAAGGAA TAA

Protein sequence

MTQKIEQSQR QERVAAWNRR AECDLAAFQN SPKQTYQAEK ARDRKLCANL EEAIRRSGLQ 
DGMTVSFHHA FRGGDLTVNM VMDVIAKMGF KNLTLASSSL SDCHAPLVEH IRRGVVTRIY 
TSGLRGPLAE EISRGLLAEP VQIHSHGGRV HLVQSGELNI DVAFLGVPSC DEFGNANGYS 
GKACCGSLGY AMVDADNAKQ VVMLTEELLP YPHNPASIEQ DQVDLIVKVD RVGDAAKIGA 
GATRMTTNPR ELLIARSAAD VIVNSGYFKE GFSMQTGTGG ASLAVTRFLE DKMRSRDIRA 
DFALGGITAT MVDLHEKGLI RKLLDVQSFD SHAAQSLARN PNHIEISANQ YANWGSKGAS 
VDRLDVVVLS ALEIDTQFNV NVLTGSDGVL RGASGGHCDT AIASALSIIV APLVRGRIPT 
LVDNVLTCIT PGSSVDILVT DHGIAVNPAR PELAERLQEA GIKVVSIEWL RERARLLTGE 
PQPIEFTDRV VAVVRYRDGS VIDVVHQVKE