Gene Francci3_2428 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_2428
Symbol
ID	3906411
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	+
Start bp	2821026
End bp	2822240
Gene Length	1215 bp
Protein Length	404 aa
Translation table	11
GC content	73%
IMG OID	637879758
Product	MmgE/PrpD
Protein accession	YP_481524
Protein GI	86741124
COG category	[R] General function prediction only
COG ID	[COG2079] Uncharacterized protein involved in propionate catabolism
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.0639632
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.19006
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAACCGA CCGCCGAGAC GTTGGCCCGG TGGGCGCACG ACTACGCGCC GAGTGCCGCG 
GACCTCGACC TGGCGCAGCG CTCGCTGCTC GACACGATAG CGGTCACGCT CGCCGCCCGG 
CAGGACGATC TGGTGGCGCT GTCGGCCGGG CTGCCGGACG CGGCGCGCTG GGCGGCGGTC 
GGGCACGTCC TGGATTTCGA CGACCTGCAC CTGGAGTCGA CCACCCACAT CAGCGTGGTG 
TGCGTCCCCG CGACGCTGGC CGTCGGCGGG GACGCCCGCG CCTACCTGGC GGGGGCCGGG 
ATGATGGCGC GGCTCGGGGT GGCGCTGGGC TGGTCGCACT ATGCCGGCGG ATGGCACGCC 
ACCTGTACGG CCGGGGCGCC GGCCGCCGCC GTGTCCGCGT CGGTGGCGCT GGGCCTGTCG 
GCCGAGCGGA TCGCCACCGC GATCGCGCTC TCGGTTCCCG CGGCCGGCGG GGTGCAGCGG 
GCATTCGGTT CCGCCGGCAA GTCCCTGCAG GTCGGCTTCG CCGCCGACGC GGGAGTTCGG 
GCGGCGAGGC TGGCCGCCGC CGGCGCCACC GCGGATCCGA CCGCGCTGGA TGCATGGCTC 
CGACTGGTCG GCGGCGACCC GGACCGCATC GACGTGACCG GCCCGGCGGT TCCCGGCGGG 
CTGGCGATCA AGATTTTTCC CTGCTGCTAC GCACTGCAAC GCCCGATCAG CGCGCTGCGC 
GAGCACCTGC CTGCCGACGT CGTCGCCTCG GGCATCACCG CGATCGAGGT GAGCACACCC 
GAGGGCGCGG TGCAGCCACT GATCCACCAT CGGCCCCGCA CCGGGCTGCA GGGGAAGTTC 
AGCCTTGAAT ATGCCATCGC CGCCGCACTG CTAGACCCCC ATCCCGGCTT CGGGAGTTTC 
ACCGACCTCG CCGTGACCCG ACCCGAAGCC CAGCGTCTGC TCCAGCTCGT AGCCGTCACC 
GAGACCCCGG GCGGTGACGG GCTGCTCTCC GGCCGCATCG ATATCACGCT CACCCTCAGC 
GGTGGCGCCC GGTACTCGGT GAGCCAGCGG CTGCCACCCG GGTCGCCCGG GCGGCCACCT 
TCGGACCAGG ACCTGCGCGC CAAGATCGCC GACTGTGGCC CCGACGTTCC CGCGCTGCTG 
ACCGGACTGG ACTGGGCGCG TGCCGCGACG CTGCTGGCAG ACCACCTGCC TGGCCAAAGG 
AGCGGCCTGA CGTGA

Protein sequence

MEPTAETLAR WAHDYAPSAA DLDLAQRSLL DTIAVTLAAR QDDLVALSAG LPDAARWAAV 
GHVLDFDDLH LESTTHISVV CVPATLAVGG DARAYLAGAG MMARLGVALG WSHYAGGWHA 
TCTAGAPAAA VSASVALGLS AERIATAIAL SVPAAGGVQR AFGSAGKSLQ VGFAADAGVR 
AARLAAAGAT ADPTALDAWL RLVGGDPDRI DVTGPAVPGG LAIKIFPCCY ALQRPISALR 
EHLPADVVAS GITAIEVSTP EGAVQPLIHH RPRTGLQGKF SLEYAIAAAL LDPHPGFGSF 
TDLAVTRPEA QRLLQLVAVT ETPGGDGLLS GRIDITLTLS GGARYSVSQR LPPGSPGRPP 
SDQDLRAKIA DCGPDVPALL TGLDWARAAT LLADHLPGQR SGLT