Gene EcHS_A2114 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A2114
Symbol	cobT
ID	5594700
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	-
Start bp	2101990
End bp	2103069
Gene Length	1080 bp
Protein Length	359 aa
Translation table	11
GC content	52%
IMG OID	640921253
Product	nicotinate-nucleotide--dimethylbenzimidazole phosphoribosyltransferase
Protein accession	YP_001458792
Protein GI	157161474
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG2038] NaMN:DMB phosphoribosyltransferase
TIGRFAM ID	[TIGR03160] nicotinate-nucleotide--dimethylbenzimidazole phosphoribosyltransferase

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.000000000000168624
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAAACAC TTGCCGATTT ACTGAATACG ATCCCTGCTA TCGATCCTGC CGCTATGTCG 
CGTGCACAAC GGCATATTGA CGGGTTACTC AAACCTGTTG GTAGCCTGGG AAGGCTGGAG 
GCGCTTGCCA TACAACTGGC GGGAATGCCG GGGTTGAATG GCATACCGCA TGTGGGCAAA 
AAAGCGGTAC TGGTTATGTG TGCCGATCAC GGCGTCTGGG AGGAAGGGGT CGCTATTTCC 
CCAAAAGAAG TGACAGCCAT TCAGGCTGAA AATATGACCC GCGGAACAAC CGGCGTGTGT 
GTGCTGGCAG CACAAGCGGG CGCTAACGTC CACGTAGTTG ATGTTGGTAT TGATAGTGCT 
GAGCCTATCC CCGGGCTTAT CAACATGCGT GTCGCACGAG GTAGCGGCAA TATTGCTTCA 
GCTCCGGCAA TGAGTCGCCG TCAGGCTGAA AAGTTGCTTT TGGACGTCAT ATGTTATACG 
CGGGAGCTGG CAAAAAACGG TGTCACGCTG TTTGGTGTAG GTGAACTGGG GATGGCAAAC 
ACGACACCGG CAGCGGCAAT AGTCAGCACA ATCACTGGCC GGGATCCTGA AGAAGTGGTT 
GGGATTGGCG CAAACCTGCC GACAGATAAA CTGGCTAATA AAATTGATGT TGTGCGTCGG 
GCGATTACGT TGAATCAACC AAATCCTCAG GATGGTATTG ATGTCCTGGC AAAAGTGGGT 
GGATTTGATT TGGTCGGAAT AGCTGGAGTG ATGTTAGGTG CTGCTTCCTG CGGTTTACCC 
GTGTTGCTGG ATGGATTTCT TTCTTATGCT GCTGCGCTCG CAGCCTGCCA GATGTCTCCT 
GCAATCAAAC CGTATCTCAT TCCTTCTCAC TTGTCGGTAG AAAAAGGCGC GCGTATAGCG 
CTCTCGCATT TGGGGCTGGA GCCTTATCTC AATATGGATA TGCGTTTAGG TGAGGGGAGT 
GGTGCAGCTC TGGCGATGCC CATCATCGAA GCTGCTTGTG CGATATACAA CAACATGGGC 
GAACTTGCTG CCAGTAATAT TGTTCTACCG GGGAATACGA CTTCTGATTT GAACAGCTAA

Protein sequence

MQTLADLLNT IPAIDPAAMS RAQRHIDGLL KPVGSLGRLE ALAIQLAGMP GLNGIPHVGK 
KAVLVMCADH GVWEEGVAIS PKEVTAIQAE NMTRGTTGVC VLAAQAGANV HVVDVGIDSA 
EPIPGLINMR VARGSGNIAS APAMSRRQAE KLLLDVICYT RELAKNGVTL FGVGELGMAN 
TTPAAAIVST ITGRDPEEVV GIGANLPTDK LANKIDVVRR AITLNQPNPQ DGIDVLAKVG 
GFDLVGIAGV MLGAASCGLP VLLDGFLSYA AALAACQMSP AIKPYLIPSH LSVEKGARIA 
LSHLGLEPYL NMDMRLGEGS GAALAMPIIE AACAIYNNMG ELAASNIVLP GNTTSDLNS