Gene Nwi_2468 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nwi_2468
Symbol
ID	3674685
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrobacter winogradskyi Nb-255
Kingdom	Bacteria
Replicon accession	NC_007406
Strand	+
Start bp	2690618
End bp	2692558
Gene Length	1941 bp
Protein Length	646 aa
Translation table	11
GC content	63%
IMG OID	637714034
Product	thiamine biosynthesis protein ThiC
Protein accession	YP_319073
Protein GI	75676652
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0422] Thiamine biosynthesis protein ThiC
TIGRFAM ID	[TIGR00190] thiamine biosynthesis protein ThiC

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACATTC GCTCCAATCC GGACACCACG CGCCCCGCCG TCACCACCGG TGCCCTGCCC 
TCGTCCCGCA AGATGTTCTC CGCGCCCGAC GCCGCGCCCG ATCTGCGGGT GCCGCTGCGT 
GAGATCCTCC TGTCCGAGGG CGCGGGCGAG CCGAACCTGC CGGTCTATGA CACCTCCGGT 
CCGTATACCG ATCCGAACGT CATCATTGAT GTGAATGCCG GGCTGCCGCG CACGCGTCTC 
GCCTGGGTGA AGGAACGCGG CGGCGTCGAG GAATATGACG GCCGAGAGAT CAAGCCGGAG 
GACAACGGCA ATGTCGGCGC AAGCCACGCC GCGGCGGCGT TCAAGGCGCA CCACAAGCCG 
CTGAGGGGCA TCGGCGATGC GCCGATCACA CAGCTGGAGT TCGCCCGCGC CGGCATCATC 
ACCAAGGAAA TGATCTATGT GGCCGAGCGC GAGAATCTCG GACGCAAGAA GCAACTCGAA 
CGCGCCGAAG CCGCGCTGGC CGACGGTGAA GCCTTCGGCG CCTCCGTACC CGCCTTCATC 
ACGCCGGAAT TCGTGCGCGA GGAGATCGCG CGCGGCCGTG CCATCATTCC TTCCAACATA 
AACCACGCCG AACTGGAGCC GATGATCATC GGCCGCAATT TCCTGGTGAA GATCAACGCC 
AATATCGGCA ACTCGGCCGT GACCTCCTCG GTTGAAGAAG AGGTGGACAA GATGGTGTGG 
GCGATCCGCT GGGGCGCCGA CACGGTGATG GACCTCTCGA CCGGCCGCAA CATTCACACC 
ACGCGCGAAT GGATTTTGCG CAACTCGCCC GTTCCGATCG GAACGGTGCC GATCTATCAG 
GCGCTGGAGA AATGCGACGG CGACCCGGTG AAACTGACGT GGGAGCTTTA TCGCGACACG 
CTGGTGGAGC AGTGCGAACA GGGCGTCGAT TACTTCACCA TCCATGCCGG CGTACGGCTG 
CCCTACATCC ACCTCACCGC CGACCGCGTC ACCGGCATCG TCTCGCGCGG CGGCTCGATC 
ATGGCGAAGT GGTGCCTCGC CCACCACAAG GAGAGCTTCC TCTATACGCA CTTCGAGGAA 
ATCTGCGACC TCATGCGCAA GTATGACGTG TCGTTCTCGC TCGGTGACGG CCTGCGCCCC 
GGCTCGATCG CGGACGCCAA CGACCGCGCG CAGTTCGCCG AACTGGAAAC GCTCGGCGAA 
CTCACGCAGA TCGCATGGAA GAAGGGCTGC CAGGTGATGA TCGAAGGCCC CGGCCACGTG 
CCGATGCACA AGATCAAGAT CAACATGGAC AAGCAGCTGA AAGAATGCGG CGAAGCGCCG 
TTCTATACGC TAGGGCCGCT GACCACCGAC ATCGCGCCTG GCTATGACCA CATCACCTCG 
GGCATCGGCG CCGCCATGAT CGGCTGGTTC GGCTGCGCGA TGCTCTGCTA CGTGACGCCG 
AAGGAGCATC TCGGCCTGCC CAACCGCGAC GACGTGAAGA CCGGCGTGAT TACCTACAAG 
ATCGCGGCGC ACGCCGCCGA CCTCGCCAAG GGCCATCCGG CCGCGCAACT GCGCGATGAC 
GCATTGAGCC GCGCGCGGTT CGACTTCCGC TGGCAGGACC AATTCAACCT CGGTCTCGAT 
CCTGACACCG CGGTCGCCTT CCACGACGAG ACGCTGCCGA AGGACGCGCA TAAGGTCGCG 
CACTTCTGTT CGATGTGCGG ACCGAAATTC TGCTCGATGA AGATCACGCA GGATGTGCGC 
GACTACGCTG CGACGCTCGG CGATAACGAG AAGGCCGCGC TCTATCCGGA CACCGCACCA 
AAGGCGAATG ACGCCGCAGG CGTCCCCGAG CCGTCTTATC GCGACCAGGG CATGAAAGAG 
ATGAGCGCGA GGTTCAAGGA GATGGGAGGT AACGTGTATC TAGATGCCGA GAAGGTGAAG 
GAGAGTAATC GGGTGTTGTG A

Protein sequence

MNIRSNPDTT RPAVTTGALP SSRKMFSAPD AAPDLRVPLR EILLSEGAGE PNLPVYDTSG 
PYTDPNVIID VNAGLPRTRL AWVKERGGVE EYDGREIKPE DNGNVGASHA AAAFKAHHKP 
LRGIGDAPIT QLEFARAGII TKEMIYVAER ENLGRKKQLE RAEAALADGE AFGASVPAFI 
TPEFVREEIA RGRAIIPSNI NHAELEPMII GRNFLVKINA NIGNSAVTSS VEEEVDKMVW 
AIRWGADTVM DLSTGRNIHT TREWILRNSP VPIGTVPIYQ ALEKCDGDPV KLTWELYRDT 
LVEQCEQGVD YFTIHAGVRL PYIHLTADRV TGIVSRGGSI MAKWCLAHHK ESFLYTHFEE 
ICDLMRKYDV SFSLGDGLRP GSIADANDRA QFAELETLGE LTQIAWKKGC QVMIEGPGHV 
PMHKIKINMD KQLKECGEAP FYTLGPLTTD IAPGYDHITS GIGAAMIGWF GCAMLCYVTP 
KEHLGLPNRD DVKTGVITYK IAAHAADLAK GHPAAQLRDD ALSRARFDFR WQDQFNLGLD 
PDTAVAFHDE TLPKDAHKVA HFCSMCGPKF CSMKITQDVR DYAATLGDNE KAALYPDTAP 
KANDAAGVPE PSYRDQGMKE MSARFKEMGG NVYLDAEKVK ESNRVL