Gene Francci3_3871 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_3871
Symbol
ID	3906639
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	-
Start bp	4633497
End bp	4634573
Gene Length	1077 bp
Protein Length	358 aa
Translation table	11
GC content	69%
IMG OID	637881197
Product	GTP-dependent nucleic acid-binding protein EngD
Protein accession	YP_482950
Protein GI	86742550
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0012] Predicted GTPase, probable translation factor
TIGRFAM ID	[TIGR00092] GTP-binding protein YchF

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.479028
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGCTTGT CGATCGGGAT CGTCGGGCTG CCCAACGTCG GCAAGTCCAC GTTGTTCAAC 
GCCCTGACGC GCAATGAGGT GCTGGCCGCG AACTACCCGT TCGCGACGAT CGAGCCGAAC 
GTGGGCGTGG TCGGGGTGCC CGATCCGCGT CTCGGCGAGC TCGCGAAGCT CTACGACAGC 
GCCCGGACGG TGCCGGCCAC GGTCAGCTTC GTGGACATCG CCGGTCTGGT CCGAGGCGCG 
TCCGAGGGGC AGGGCCTGGG TAACCGCTTC CTCGCGAACA TCCGCGAGTC CGACGCGGTC 
TGCCAGGTCG TCCGGGTGTT CTCCGACCCC GACGTGGTGC ACGTCGAGGG CAGGGTCGAC 
CCGGCCGACG ACATCGAGAC GATCAACACC GAGCTGATCC TCGCCGATCT GCAGACCGTT 
GACGCGCGCC TGCCGAAGCT GGAGAAGGAG GCCCGTGCCG ACAAGGCGAA GCAGCCGTTG 
CTGGCCGCGG TGAAGGCCGC GCGCGAGGTG CTTGACGCCG GCCGCACGCT GTCCTCGGAA 
CCGAAGATCG ATCGCGACGC CCTGCGGGAG CTTTTCCTGC TCACCGCCAA GCCCTTCCTC 
TACGTCTTCA ACGTCGACGA GGACGTCCTC GCCGATCCCG GTCGGCGCAA GGAACTTGTC 
GGCTCCGTCG CGCCCGCGGA CGCGATCGTG CTGTGCGCCA AGGTCGAGGC CGAACTGGCC 
GAGCTCGACG AGGCCGACGC CGCGGAGCTG CTGGCCTCGC TCGGCCAGGA GGAGAGCGGC 
CTTGCCCAGC TGGCCCGGAT CGGTTTCCAC ACCCTGGGGC TCCAGACGTT CCTGACGGCA 
GGCCCGAAGG AGGCCCGGGC CTGGACCATC AGAGCCGGGG CGACCGCGCC GGAGGCCGCC 
GGGGCCATCC ACACCGACTT CCAGCGCGGC TTCATCAAGG CCGAGATCGT CTCGTACGAC 
GCCCTGATCG CGGCCGGTTC GATGGCCGCC GCCCGCGCGG CCGGCAAGGT GCGCATGGAG 
GGCAAGGACT ACGTGATGGC CGACGGCGAC GTCGTGGAGT TCCGCTTCAA CGTCTGA

Protein sequence

MGLSIGIVGL PNVGKSTLFN ALTRNEVLAA NYPFATIEPN VGVVGVPDPR LGELAKLYDS 
ARTVPATVSF VDIAGLVRGA SEGQGLGNRF LANIRESDAV CQVVRVFSDP DVVHVEGRVD 
PADDIETINT ELILADLQTV DARLPKLEKE ARADKAKQPL LAAVKAAREV LDAGRTLSSE 
PKIDRDALRE LFLLTAKPFL YVFNVDEDVL ADPGRRKELV GSVAPADAIV LCAKVEAELA 
ELDEADAAEL LASLGQEESG LAQLARIGFH TLGLQTFLTA GPKEARAWTI RAGATAPEAA 
GAIHTDFQRG FIKAEIVSYD ALIAAGSMAA ARAAGKVRME GKDYVMADGD VVEFRFNV