Gene ECD_00633 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECD_00633
Symbol	nagC
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21(DE3)
Kingdom	Bacteria
Replicon accession	CP001509
Strand	-
Start bp	660248
End bp	661468
Gene Length	1221 bp
Protein Length	406 aa
Translation table	11
GC content	53%
IMG OID
Product	DNA-binding transcriptional dual regulator, repressor of N-acetylglucosamine
Protein accession	ACT42509
Protein GI	253976839
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.00296536
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACACCAG GCGGACAAGC TCAGATAGGT AATGTTGATC TCGTAAAACA GCTTAACAGC 
GCGGCGGTTT ATCGCCTGAT TGACCAGTAC GGGCCAATCT CGCGGATTCA GATTGCCGAG 
CAAAGCCAGC TTGCCCCCGC CAGCGTAACC AAAATTACGC GTCAGCTTAT CGAACGCGGG 
CTGATCAAAG AGGTTGATCA GCAGGCCTCC ACTGGGGGCC GCCGCGCTAT CTCTATTGTC 
ACCGAAACCC GCAATTTCCA CGCAATCGGC GTACGGCTTG GTCGTCACGA CGCCACCATC 
ACTCTGTTTG ATCTCAGTAG CAAAGTGCTG GCAGAAGAAC ATTACCCGCT GCCGGAACGT 
ACCCAGCAGA CGCTGGAACA TGCCCTGCTT AACGCCATTG CTCAGTTTAT TGATAGCTAC 
CAGCGCAAGC TGCGCGAGCT GATCGCGATT TCGGTGATCC TGCCAGGGCT TGTTGACCCG 
GACAGCGGCA AAATTCATTA CATGCCGCAT ATTCAGGTAG AAAACTGGGG GCTGGTAGAA 
GCTCTGGAAG AACGTTTTAA AGTGACCTGT TTCGTTGGTC ACGATATCCG TAGTCTGGCG 
CTGGCGGAGC ACTACTTCGG TGCAAGTCAG GATTGCGAAG ACTCCATTCT GGTGCGTGTC 
CATCGCGGAA CCGGGGCCGG GATTATCTCT AACGGGCGCA TTTTTATTGG CCGCAACGGC 
AACGTCGGTG AAATTGGCCA TATTCAGGTC GAACCGCTGG GTGAACGCTG CCACTGCGGC 
AACTTTGGCT GCCTGGAAAC TATCGCCGCC AACGCTGCCA TTGAACAACG GGTGTTGAAT 
CTGTTAAAGC AGGGCTACCA GAGCCGTGTG CCACTGGACG ACTGCACCAT CAAAACTATC 
TGCAAAGCCG CGAACAAAGG CGATAGCCTG GCCTCGGAAG TGATTGAGTA TGTCGGTCGT 
CATCTGGGCA AAACCATCGC CATTGCTATC AACTTATTTA ATCCGCAAAA AATTGTTATC 
GCTGGTGAAA TCACCGAAGC CGATAAAGTG CTGCTCCCTG CTATTGAAAG CTGCATTAAT 
ACCCAGGCGC TGAAGGCGTT TCGCACTAAT CTGCCGGTGG TACGTTCTGA GCTGGATCAC 
CGCTCGGCAA TCGGCGCTTT TGCGCTGGTA AAACGCGCCA TGCTCAACGG TATTTTGCTC 
CAGCATTTGC TGGAAAATTA A

Protein sequence

MTPGGQAQIG NVDLVKQLNS AAVYRLIDQY GPISRIQIAE QSQLAPASVT KITRQLIERG 
LIKEVDQQAS TGGRRAISIV TETRNFHAIG VRLGRHDATI TLFDLSSKVL AEEHYPLPER 
TQQTLEHALL NAIAQFIDSY QRKLRELIAI SVILPGLVDP DSGKIHYMPH IQVENWGLVE 
ALEERFKVTC FVGHDIRSLA LAEHYFGASQ DCEDSILVRV HRGTGAGIIS NGRIFIGRNG 
NVGEIGHIQV EPLGERCHCG NFGCLETIAA NAAIEQRVLN LLKQGYQSRV PLDDCTIKTI 
CKAANKGDSL ASEVIEYVGR HLGKTIAIAI NLFNPQKIVI AGEITEADKV LLPAIESCIN 
TQALKAFRTN LPVVRSELDH RSAIGAFALV KRAMLNGILL QHLLEN