Gene EcHS_A0666 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A0666
Symbol	citF
ID	5593591
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	-
Start bp	684119
End bp	685651
Gene Length	1533 bp
Protein Length	510 aa
Translation table	11
GC content	56%
IMG OID	640919847
Product	citrate lyase alpha chain
Protein accession	YP_001457429
Protein GI	157160111
COG category	[C] Energy production and conversion
COG ID	[COG3051] Citrate lyase, alpha subunit
TIGRFAM ID	[TIGR01584] citrate lyase, alpha subunit

Plasmid Coverage information

Num covering plasmid clones	53
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACGCAGA AAATTGAACA ATCTCAACGA CAAGAACGGG TAGCGGCCTG GAATCGTCGC 
GCTGAATGCG ATCTTGCCGC TTTCCAGAAC TCACCAAAGC AAACCTACCA GGCTGAAAAA 
GTGCGCGATC GCAAACTGTG CGCCAACCTG GAAGAAGCGA TTCGTCGCTC TGGTTTACAG 
GACGGCATGA CGGTTTCCTT CCATCACGCT TTCCGTGGCG GTGACCTGAC CGTCAATATG 
GTGATGGACG TCATCGCGAA GATGGGCTTT AAAAACCTGA CCCTGGCGTC CAGCTCCCTG 
AGTGATTGCC ATGCGCCGCT GGTAGAACAC ATTCGCCAGG GCGTGGTTAC CCGCATTTAT 
ACCTCCGGCC TGCGTGGTCC ACTGGCGGAA GAGATCTCCC GTGGTCTGCT GGCGGAACCG 
GTGCAGATCC ACTCTCACGG CGGACGTGTG CATCTGGTAC AGAGCGGCGA ACTGAATATC 
GACGTGGCTT TCCTCGGCGT CCCGTCCTGT GATGAATTCG GTAATGCCAA CGGCTACACC 
GGTAAAGCCT GCTGCGGCTC CCTCGGCTAT GCAATGGTTG ATGCCGACAA CGCAAAACAG 
GTTGTGATGC TTACCGAAGA ACTGCTGCCT TATCCGCATA ATCCGGCAAG CATTGAGCAA 
GATCAGGTTG ATCTGATCGT CAAAGTTGAT CGCGTTGGCG ATGCTGCAAA AATCGGCGCT 
GGCGCTACCC GTATGACCAC TAACCCGCGC GAACTGCTTA TTGCCCGTAG CGCTGCGGAT 
GTGATTGTCA ACTCTGGCTA CTTCAAAGAA GGTTTCTCCA TGCAAACCGG CACCGGCGGC 
GCATCGCTGG CGGTAACCCG TTTCCTGGAA GACAAAATGC GTAGCCGCGA TATTCGCGCC 
GACTTCGCCC TTGGCGGTAT TACCGCGACG ATGGTTGACC TGCACGAAAA AGGTCTGATC 
CGCAAACTGC TGGATGTGCA GAGCTTTGAC AGCCATGCTG CGCAATCGCT GGCCCGTAAC 
CCCAATCACA TCGAAATCAG CGCCAACCAG TACGCTAACT GGGGTTCGAA AGGCGCATCG 
GTTGATCGTC TCGACGTGGT GGTACTGAGC GCGCTGGAAA TTGACACCCA GTTCAACGTT 
AACGTGCTGA CCGGCTCTGA CGGCGTACTG CGTGGTGCTT CCGGTGGTCA CTGCGATACC 
GCAATTGCCT CTGCGCTTTC CATCATCGTC GCGCCGCTGG TACGCGGTCG TATTCCGACT 
CTGGTGGATA ACGTGCTGAC CTGCATCACC CCGGGCTCCA GTGTCGATAT TCTGGTCACA 
GACCACGGTA TCGCAGTTAA CCCGGCACGT CCGGAACTGG CAGAACGTCT GCAGGAAGCG 
GGCATTAAAG TGGTTTCCAT TGAGTGGCTG CGCGAACGTG CGCGTCTGCT GACCGGTGAA 
CCACAGCCGA TTGAATTCAC CGACCGCGTC GTTGCCGTTG TGCGTTACCG CGATGGCTCG 
GTGATCGATG TTGTGCATCA GGTGAAGGAA TAA

Protein sequence

MTQKIEQSQR QERVAAWNRR AECDLAAFQN SPKQTYQAEK VRDRKLCANL EEAIRRSGLQ 
DGMTVSFHHA FRGGDLTVNM VMDVIAKMGF KNLTLASSSL SDCHAPLVEH IRQGVVTRIY 
TSGLRGPLAE EISRGLLAEP VQIHSHGGRV HLVQSGELNI DVAFLGVPSC DEFGNANGYT 
GKACCGSLGY AMVDADNAKQ VVMLTEELLP YPHNPASIEQ DQVDLIVKVD RVGDAAKIGA 
GATRMTTNPR ELLIARSAAD VIVNSGYFKE GFSMQTGTGG ASLAVTRFLE DKMRSRDIRA 
DFALGGITAT MVDLHEKGLI RKLLDVQSFD SHAAQSLARN PNHIEISANQ YANWGSKGAS 
VDRLDVVVLS ALEIDTQFNV NVLTGSDGVL RGASGGHCDT AIASALSIIV APLVRGRIPT 
LVDNVLTCIT PGSSVDILVT DHGIAVNPAR PELAERLQEA GIKVVSIEWL RERARLLTGE 
PQPIEFTDRV VAVVRYRDGS VIDVVHQVKE