Gene Francci3_2656 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_2656
Symbol
ID	3906329
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	-
Start bp	3135839
End bp	3137425
Gene Length	1587 bp
Protein Length	528 aa
Translation table	11
GC content	73%
IMG OID	637879981
Product	2-methylcitrate dehydratase
Protein accession	YP_481747
Protein GI	86741347
COG category	[R] General function prediction only
COG ID	[COG2079] Uncharacterized protein involved in propionate catabolism
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.298915
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.184722
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGCTGC ACGAGGTGCG CGCCCGCCGG TCCGTCGAGG CGCCGCCCCG GCGTGACCAG 
CTTGCCTGGA AGATCGCCGA GGTCGCCGCC GAGCGGGTGC CGGTGCCGCC GGAGGTCGTC 
GAGATGATCG GCAACCGAAT CATCGACAAC GCGGCGGTCG CCGCGGCGGC GCTGACCCGC 
GGCCCGGTCG TCGCGGCCCG CGACCAGGCG CTCGCCCATC CGTACACCCC GGGAGCGACG 
GTCGTCGGCG TCGAGCGGGC AGTACGGGTG TCGCCGGAGT GGACGGCCTG GGCGAACGGC 
GTCGCCGTGC GGGAACTGGA CTTCCACGAC ACCTACCTGG CCGCGGACTA CTCCCATCCG 
GGCGACAACA TCCCCCCGGT GCTCGCCGTC GCGCAGCACA CCGGCCGCGG CGGCGCCGAG 
CTGGTCCACG GGATCGCCAC CGCGTACGGG ATCCAGGTCG ACCTGGTGAC CGGCATCTGC 
CTGCACGAAC ACCGCATCGA CCACATCGCC CACCTGGGCC CCTCCGCCGT CGCCGGGATC 
GGTGCCCTGC TCGGCCTGCC CCCCGAGCCG ATCTACCAGG CCGTCGGCCA GGCGTTGCAC 
ACGACGACGA CCACCCGTCA GGCCCGCAAG GGCGAGATCT CCACCTGGAA GGCGTACGCC 
CCGGCCTTCG CCGGCAAGAC GGCGGTGGAG GCGGTCGACC GGGCGATGCG CGGCCAGACC 
TCGCCGGCGC CGATCTACGA GGGGGAGGAC GGGGTCGTCG CCTGGCTGCT CGGCGGCCCG 
GACGCGGTGT ACCGGGTGGC GCTGCCGGAA CCCGGCGAGC CCCGTCGGGG CATCCTCGCC 
ACCTATCCCA AGGAGCACTC CGCCGAGTAC CAGAGCCAGG CGCTGATCGA CCTGGCCCGC 
CGGCTGCGTA CCCGGCTGCC CGGGACCGGC TCGTCTCTCG GGGCCGGCTC GTCTCTCGGG 
GCCGGCTCGT CCACGGCCTC CTCCGAAGCC TCCTTCGAGG TCGACGTCGC GGCGATCCGC 
CAGATCGTCA TCCACACCAG CCATCACACG CATCACGTGA TCGGCACCGG CGCCGGGGAT 
CCGCAGAAGG CCGATCCGAC CGCGAGCCGG GAGACGCTCG ACCATTCGAT CATGTATATC 
TTCGCGGTGG CGCTGCAGGA CGGGACGTGG CACCACGAAC GTTCCTACGC CCCCGAACGG 
GCCGCCCGGC CCGACACCGT CGCGCTGTGG CACCGGATCC GCACGGTGGA GGATCCGCAG 
TGGACCCGCC GTTACCACGC GACCGACCCG GCCGAGCGGG CCTTCGGCGG GCGGGTGGAG 
GTCACGCTCG TTGACGGGAC GTCGATCGTG GACGAGATCG CCGTCGCCGA CGCGCATCCG 
GCCGGGGCCC GGCCGTTCCG GCGTGCGGAC TACGTCGCCA AGCTGCGTAT GCTCGCCGAG 
GGGGTCGTGT CGGCCGCCGA ACAGGACCGG TTCCTCGACC TGGTCGGCCG GCTCGACACC 
CTGACCCCGG CCGAGCTCGC CGGGCTGACC CTCGTCGCCG ACGCGCTCGC CCTGGAAACG 
GGCGGGACGA GGGGGGTCTT CGCATGA

Protein sequence

MKLHEVRARR SVEAPPRRDQ LAWKIAEVAA ERVPVPPEVV EMIGNRIIDN AAVAAAALTR 
GPVVAARDQA LAHPYTPGAT VVGVERAVRV SPEWTAWANG VAVRELDFHD TYLAADYSHP 
GDNIPPVLAV AQHTGRGGAE LVHGIATAYG IQVDLVTGIC LHEHRIDHIA HLGPSAVAGI 
GALLGLPPEP IYQAVGQALH TTTTTRQARK GEISTWKAYA PAFAGKTAVE AVDRAMRGQT 
SPAPIYEGED GVVAWLLGGP DAVYRVALPE PGEPRRGILA TYPKEHSAEY QSQALIDLAR 
RLRTRLPGTG SSLGAGSSLG AGSSTASSEA SFEVDVAAIR QIVIHTSHHT HHVIGTGAGD 
PQKADPTASR ETLDHSIMYI FAVALQDGTW HHERSYAPER AARPDTVALW HRIRTVEDPQ 
WTRRYHATDP AERAFGGRVE VTLVDGTSIV DEIAVADAHP AGARPFRRAD YVAKLRMLAE 
GVVSAAEQDR FLDLVGRLDT LTPAELAGLT LVADALALET GGTRGVFA