Gene Franean1_4664 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_4664
Symbol
ID	5675742
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	5566925
End bp	5568154
Gene Length	1230 bp
Protein Length	409 aa
Translation table	11
GC content	77%
IMG OID	641243521
Product	ROK family protein
Protein accession	YP_001508937
Protein GI	158316429
COG category	[G] Carbohydrate transport and metabolism [K] Transcription
COG ID	[COG1940] Transcriptional regulator/sugar kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.213413
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.717223
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCCCTTGG AGCTGTCCGG ACCGCGACCG ACGAGCGGGG CCCGGCAGGC GACCCTGCGT 
GAGAGCAACC TCGCCCTGGT CGCCCGCACC GTCGCCGCCG CGGCGCCGGC GTACCTTTCG 
CGGGCGGACG TCGCCGGAGC GACCTCGATG ACCCGGGCCA CCGCGTCGCG CCTCGTCGAC 
GAGCTCGTCG CCGGCGGTGT CGTGGACGAG CTGGGCCCGG ACGAGCTGGA CCGGCCCGCG 
CCCCGCCGCG GCCGGCCAGG GACGCCGCTG GCCCCGGGCT CGCGGATCGC GGCGCTGGGG 
CTCCAGATCG ACGCCGGATT CCTGGCGGCC AGAGTGATCA ACCTGCGCGG CCAGGTGCTC 
GCCGAGTGGG TCGAGAGCGG GGATCTCACC GCGAGCCCGC CGGAGGTGGT GCTGCGTCGC 
CTCGACGCCG CGAGCGGCGA CGTCCTGTCC CGGCTGCCCA CCGGATCCCG CCTCGTCGGA 
GCCCGGCTCG CCCTGCCCGG CATCGTCGCC GTGGGGGAGG GGCTGCTGCT GCGGGCACCG 
ACCCTCGGCT GGTCGGACCT CCGGTTGGTC GACGTGCTGG GCGTGGGGAC GCTCGCCGGC 
CTGCCGTTGA CGATCGGCAA CGAAGCTGAC CTGGCCGCGC GGGCGGTCGC CGAGAGCGCG 
CCGGGACGGT CCGGCCCGCT GCCGGATTTC ATCTACCTGT CGGGCGGGAT CGGCATCGGC 
GGCGCCGTGG TCCGGGGCGG TCAGGTCATC ACCGGCCCGC ACGGCTGGGC CGGCGAGATC 
GGGCACGTCT GCGTCGACCC CAACGGCCCG AGCTGCCCGT GCGGGTCGAC CGGCTGCCTG 
GAGCGTTACG CCGGGCGGCA CACGCTGCTC GCCGCCGTCG GGCTGGGCGC GACCGCGCCG 
CCCGACCGCC TGTTCGAGCG GGTGGCGGCC GGCGATCAGG ACGCGTGCCA GGCCGTCGGT 
GTGGCGGCAT GGGCCCTCAG CATCGCGATG GCCAGCGTCA TCAACATGTT CGACGTTCCC 
ACCGTTGTCC TCGGGGGCTA TCTGGGCCAG ATCGCCGGCC TGCTGCGCCC GGACCTGGAC 
CCGGCGCTGC GGGCCCGCGT GCTGTCGGCC CGCTGGGTCG CGCCGACGAT CGTCGCGGCC 
GAGCCCGGCT CCGCCCCCGG CGCCACCGGC GCGGCCTTCG CTGAGCTGGC GGCGGTGATC 
GCCGATCCGG CGCGCTGGAC GGTCCGGTAG

Protein sequence

MPLELSGPRP TSGARQATLR ESNLALVART VAAAAPAYLS RADVAGATSM TRATASRLVD 
ELVAGGVVDE LGPDELDRPA PRRGRPGTPL APGSRIAALG LQIDAGFLAA RVINLRGQVL 
AEWVESGDLT ASPPEVVLRR LDAASGDVLS RLPTGSRLVG ARLALPGIVA VGEGLLLRAP 
TLGWSDLRLV DVLGVGTLAG LPLTIGNEAD LAARAVAESA PGRSGPLPDF IYLSGGIGIG 
GAVVRGGQVI TGPHGWAGEI GHVCVDPNGP SCPCGSTGCL ERYAGRHTLL AAVGLGATAP 
PDRLFERVAA GDQDACQAVG VAAWALSIAM ASVINMFDVP TVVLGGYLGQ IAGLLRPDLD 
PALRARVLSA RWVAPTIVAA EPGSAPGATG AAFAELAAVI ADPARWTVR