Gene Francci3_3092 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_3092
Symbol
ID	3904218
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	-
Start bp	3663788
End bp	3664846
Gene Length	1059 bp
Protein Length	352 aa
Translation table	11
GC content	72%
IMG OID	637880413
Product	glucokinase
Protein accession	YP_482178
Protein GI	86741778
COG category	[G] Carbohydrate transport and metabolism [K] Transcription
COG ID	[COG1940] Transcriptional regulator/sugar kinase
TIGRFAM ID	[TIGR00744] ROK family protein (putative glucokinase)

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGCATCG CTACTCCTGA TAGTTCGAAG AACCTGGATA TTCCGGGCAG CTTGACGGTT 
CCGCGCGCCG AGCGTGCCGG CGCGGCCCCC GGCCCGTTGC CGGCGGAGAA CCGGATGGAG 
GGCCTGACGA TCGGCATCGA CGTTGGCGGG ACGAAGGTCG CCGCCGGCGT CGTGGACGGT 
GCGGGGACGA TCATCACTTC CCTGCGTCGG CCCACCCCGG GCCATTCGGC CGCCGAGGTC 
GCGGACACCA TCGCCAGCGT CGTCGCGGAG CTCAGTGCCG ACCACGCCGT GCGCGCGGTC 
GGCATCGGCG CGGCCGGGTG GGTCGACTCG GACCGGTCCC GCGTCCTGTT CGCACCGAAC 
CTCGCCTGGC GCGACGAACC CCTGCGCGAC GAGGTCGGGG GGCGCATCGG CCTGCCCGTC 
GTCGTGGAGA ACGACGCCAA CGCGATGGCC TGGGCGGAGT ACCGTTTCGG GGCCGGCCGT 
GGCCGGCGTG ACCTCGTCTG CCTGACGGTG GGAACCGGCA TCGGCAGCGG CATCGTCCTG 
GGCGGTGAGC TCTACCGGGG CGCGTCCGGT ATCGGCGCCG AGATGGGTCA CATGCGGGTG 
GTACCCGACG GGTATCCGTG CGGTTGTGGT AACAGAGGGT GTTGGGAACA GTATGCGAGC 
GGGCGAGCGC TGGTCCGGCT GGCGAAGAAC ATCGCCACCG TGGATCCGAG TGCGGCCGTG 
CCCATGCTGG AGCATTGCGG CGGTGGCGTC GACGCGCTGA CCGGCCCGGA CGTCACCGAG 
GCGGCGCGCA AGGGGGACCC GGCGGCGATC AGGTGCTTCA CCGAGATCGG CCACTGGCTC 
GGCGAGGGCA TGGCGATGCT GGTCGCCGCG CTCGACCCGA ACCGCTTCGT CATCGGCGGC 
GGCGTCTCCG ACGCCGGCGA GCTGCTGCTC GGCCCGGCCC GGCAGAGCCT CCTGGCCGCT 
ATGCCCGGGC GGGATTACCG TTCCGAGCCG GACATCGTCA TCGCCGAGCT CGGATCCCAA 
GCGGGCCTCG TAGGCGCGGC CGACCTCGCC CGGTTCTGA

Protein sequence

MSIATPDSSK NLDIPGSLTV PRAERAGAAP GPLPAENRME GLTIGIDVGG TKVAAGVVDG 
AGTIITSLRR PTPGHSAAEV ADTIASVVAE LSADHAVRAV GIGAAGWVDS DRSRVLFAPN 
LAWRDEPLRD EVGGRIGLPV VVENDANAMA WAEYRFGAGR GRRDLVCLTV GTGIGSGIVL 
GGELYRGASG IGAEMGHMRV VPDGYPCGCG NRGCWEQYAS GRALVRLAKN IATVDPSAAV 
PMLEHCGGGV DALTGPDVTE AARKGDPAAI RCFTEIGHWL GEGMAMLVAA LDPNRFVIGG 
GVSDAGELLL GPARQSLLAA MPGRDYRSEP DIVIAELGSQ AGLVGAADLA RF