Gene EcolC_2980 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_2980
Symbol
ID	6065762
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	+
Start bp	3254776
End bp	3255996
Gene Length	1221 bp
Protein Length	406 aa
Translation table	11
GC content	53%
IMG OID	641602390
Product	ROK family protein
Protein accession	YP_001725932
Protein GI	170020978
COG category	[G] Carbohydrate transport and metabolism [K] Transcription
COG ID	[COG1940] Transcriptional regulator/sugar kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.00049785
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACACCAG GCGGACAAGC TCAGATAGGT AATGTTGATC TCGTAAAACA GCTTAACAGC 
GCGGCGGTTT ATCGCCTGAT TGACCAGTAC GGGCCAATCT CGCGGATTCA GATTGCCGAG 
CAAAGCCAGC TTGCCCCCGC CAGCGTAACC AAAATTACGC GTCAGCTTAT CGAACGCGGG 
CTGATCAAAG AAGTTGATCA GCAGGCCTCC ACCGGGGGCC GCCGCGCTAT CTCTATCGTC 
ACCGAAACCC GCAATTTCCA CGCAATCGGT GTACGGCTTG GTCGTCACGA CGCCACCATC 
ACTCTGTTTG ATCTCAGCAG CAAAGTGCTG GCAGAAGAAC ATTACCCGCT GCCGGAACGT 
ACCCAGCAGA CGCTGGAACA TGCCCTGCTG AATGCCATTG CTCAGTTTAT TGATAGCTAC 
CAACGCAAGC TGCGCGAGCT GATCGCCATT TCCGTGATCC TGCCTGGACT TGTTGACCCG 
GACAGCGGCA AAATTCATTA CATGCCGCAT ATTCAGGTGG AAAACTGGGG GCTGGTAGAA 
GCACTGGAAG AGCGTTTTAA AGTGACCTGT TTCGTTGGTC ACGATATCCG TAGTCTGGCG 
CTGGCAGAGC ACTACTTCGG TGCAAGTCAG GATTGCGAAG ACTCCATTTT AGTGCGTGTC 
CATCGCGGAA CCGGGGCCGG AATCATCTCT AACGGGCGCA TTTTTATTGG CCGCAACGGC 
AACGTCGGTG AAATTGGCCA TATTCAGGTC GAACCGCTGG GTGAACGCTG CCACTGCGGC 
AACTTTGGCT GCCTGGAAAC TATCGCCGCC AACGCTGCCA TTGAACAACG GGTGTTGAAT 
CTGTTAAAGC AGGGCTACCA GAGCCGCGTG CCGCTGGACG ACTGTACCAT CAAAACTATC 
TGCAAAGCTG CGAACAAAGG CGATAGCCTG GCGTCGGAAG TGATTGAGTA TGTTGGTCGT 
CATCTGGGCA AAACCATCGC CATTGCCATC AACCTGTTTA ACCCGCAAAA AATTGTTATT 
GCCGGAGAAA TCACCGAAGC CGATAAAGTG CTGCTCCCTG CTATTGAAAG CTGCATTAAT 
ACCCAGGCGC TGAAGGCGTT TCGTACTAAT CTGCCGGTGG TACGTTCTGA GCTGGATCAC 
CGCTCGGCAA TCGGCGCTTT TGCGCTGGTA AAACGCGCCA TGCTCAACGG TATTTTGCTC 
CAGCATTTGC TGGAAAATTA A

Protein sequence

MTPGGQAQIG NVDLVKQLNS AAVYRLIDQY GPISRIQIAE QSQLAPASVT KITRQLIERG 
LIKEVDQQAS TGGRRAISIV TETRNFHAIG VRLGRHDATI TLFDLSSKVL AEEHYPLPER 
TQQTLEHALL NAIAQFIDSY QRKLRELIAI SVILPGLVDP DSGKIHYMPH IQVENWGLVE 
ALEERFKVTC FVGHDIRSLA LAEHYFGASQ DCEDSILVRV HRGTGAGIIS NGRIFIGRNG 
NVGEIGHIQV EPLGERCHCG NFGCLETIAA NAAIEQRVLN LLKQGYQSRV PLDDCTIKTI 
CKAANKGDSL ASEVIEYVGR HLGKTIAIAI NLFNPQKIVI AGEITEADKV LLPAIESCIN 
TQALKAFRTN LPVVRSELDH RSAIGAFALV KRAMLNGILL QHLLEN