Gene Nwi_0073 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nwi_0073
Symbol
ID	3675632
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrobacter winogradskyi Nb-255
Kingdom	Bacteria
Replicon accession	NC_007406
Strand	+
Start bp	87836
End bp	88846
Gene Length	1011 bp
Protein Length	336 aa
Translation table	11
GC content	65%
IMG OID	637711609
Product	thioredoxin-related
Protein accession	YP_316693
Protein GI	75674272
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG3118] Thioredoxin domain-containing protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.0246134
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCTGGCCA AGCATCGGCG AACGTCGGAT AACGGCACCA GACCGCTCAT TCCGGGGACA 
TCAGGCGAGG ATCACGTGAC CATAGTCGAG CACGACGGCG GGCCGCCACC ACAGGCGCCG 
GATCTGATCA ACGAGACGAC GACGCAGACC TTCATGAAGG ATGTCGTCGA GGAATCGATG 
CACCAGCCGG TGCTGGTCGA TTTCTGGGCG CCGCGGAGCG GACCGAGCCG CCAACTGAGC 
CCGCTGCTGG AAAAGGCGGT GCGCGCCGCC GCCGGCAAGG TCAAGCTGGC GAAGATGAAT 
ATCGATCAGC ATCCCGCCAT CTTTCAGCAG CTCGCGGCCC AGATCGGCAG CCATTCGATC 
CCGGCGGTGT TCGCCTTCGT CGGCGGGCGG CCGGTCGATT ATTTCACAGG CGCGGTCCCC 
GAAAGCCAGG TCAAGGACTT CATCGACAAG CTGACGCAAG GCGCGGGGGC GGCGCCGGGC 
GCCCCTAACA TCGAAGAGAT CCTGCAAGAG GCTGACGCCG CGCTCGCTGC AGGCGATCCG 
GCCACCGCGG CCGCGGTTTA TGCCGAGGCT CTCGGGATCG ACGCCGCCAA TCTTCGGGCG 
ATCGCCGGGC TGGCGCGCTG CTATGCCAGC ACCGGCGCGA TCGACAAGGC CAAGCAAACG 
CTCGCGCTGG TTCCGGAATC GAAGCGTGGC GACGCCGCCG TGACAACCGT TCAGGCCATG 
ATCGACCTTG CCGAACAGGC GAGCTCGCTT GGACCGATCG CCGAGCTTGA GCAGAAGGTC 
GCGGCCGACC CGCTCGATCA TCAGGCACGC TTCGACCTGG CTACGGCATT GAACGCCGGC 
GGCAAACGCA GCGAGGCCAC CGATCACCTG CTTGAAATCG TGAAGCGCGA TCGCAAATGG 
AACGATGATG CCGCCCGCAA GCAGCTTGTG CAGTTTTTCG AGGCATGGGG CGCCACAGAC 
GAGGCCACCG TGGAGGGGCG CAAACGACTG TCGACGATTC TGTTTTCCTA A

Protein sequence

MLAKHRRTSD NGTRPLIPGT SGEDHVTIVE HDGGPPPQAP DLINETTTQT FMKDVVEESM 
HQPVLVDFWA PRSGPSRQLS PLLEKAVRAA AGKVKLAKMN IDQHPAIFQQ LAAQIGSHSI 
PAVFAFVGGR PVDYFTGAVP ESQVKDFIDK LTQGAGAAPG APNIEEILQE ADAALAAGDP 
ATAAAVYAEA LGIDAANLRA IAGLARCYAS TGAIDKAKQT LALVPESKRG DAAVTTVQAM 
IDLAEQASSL GPIAELEQKV AADPLDHQAR FDLATALNAG GKRSEATDHL LEIVKRDRKW 
NDDAARKQLV QFFEAWGATD EATVEGRKRL STILFS