Gene Nwi_2020 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nwi_2020
Symbol	engA
ID	3677090
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrobacter winogradskyi Nb-255
Kingdom	Bacteria
Replicon accession	NC_007406
Strand	-
Start bp	2210944
End bp	2212311
Gene Length	1368 bp
Protein Length	455 aa
Translation table	11
GC content	63%
IMG OID	637713584
Product	GTP-binding protein EngA
Protein accession	YP_318631
Protein GI	75676210
COG category	[R] General function prediction only
COG ID	[COG1160] Predicted GTPases
TIGRFAM ID	[TIGR00231] small GTP-binding protein domain [TIGR03594] ribosome-associated GTPase EngA

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.866056
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTTTTA CCATTGCTAT CATAGGCCGT CCGAACGTCG GAAAATCGAC GCTGTTCAAC 
CGTCTGGTCG GGCAGAAGCT GGCGTTGGTT GACGACGAGC CGGGCGTGAC GCGCGATCGC 
CGCGAGGGGC AGGCGCGTCT CGGCGATCTC GATTTCACGG TGATCGACAC CGCCGGCCTC 
GACGAGGGAC CGCGCGGCTC TCTGACGGCG CGCATGCAGG AGCAGACCGA GGCCGCGATT 
GCAGCTGCCG ATGCGCTGAT GTTCGTATTC GATGCGCGCG CGGGCCTCAC GCCGACGGAT 
CGCTCATTCG CGGATTTCGC GCGCCGCGCC GACAAGCCGG TCGTGCTCGT CGCCAACAAG 
AGCGAGGGCA GGCACGGGGA CGCCGGTGCG CTGGAATCCT ACGCGCTCGG GCTCGGCGAT 
CCGGTCGGCG TATCCGCGGA ACACGATGAA GGCATGAGCG ATCTTTATGA TGCCTTGCGC 
TCGGTGATGC CGGAGCCGGC GGAAGAGGTC GACGAGGAGG AGATCGTCGA GCCCGATATG 
TCGCGGCCGA TCCGCGTGGC CATTGTCGGG CGGCCCAACG CGGGCAAATC GACCGTGATC 
AATTATCTGC TCAGCGAGGA GCGGCTGCTG ACGAGTCCGG AAGCCGGCAC GACGCGGGAC 
TCGATCTCGG TCGAGCTTAA CTGGAAGGGA CGCGATTTCC GCATCTTCGA CACCGCCGGA 
TTGCGGCGCA GGTCGCGGAT CGAGGCAAAG CTCGAGAAAT TGTCGGTGGC GGATACGTTG 
CGCGCCGTCA GGTTCGCCGA AGCCGTCGTG TTGATGATGG ATGCGCAGAA CAGGTTCGAG 
GAGCAGGATC TCCGCATCGC CGATTTGATC GAGCGCGAAG GCCGCGCGCT CGTGATTGCC 
GTGAATAAAT GGGACTTGAT GAAGGGCGGT TCGGCGCGGA TCGCCTCGCT GCGCAACGAT 
GTCGATCACT GGCTGCCTCA AATCAGGGGT GCTCCGGTGG TCGCGATTTC TGGCCTGACA 
GGAGAGGGAA TTGATAGGCT GATGATCGCG ATCCAAACCG CCTATGCCGT ATGGAATCGC 
CGTGTCGCAA CGGCGTTGCT CAATCGCTGG TTTCAGCAGG CGGTCGCAGC CAGTCCGCCG 
CCCGCGGTCT CCGGTCGTCG GCTGAAGCTC AACTACGCAA CGCAGACCAA GGCGCGTCCG 
CCGAGCTTTG TGGTGTTTTG TTCGCGGGCG GATGCCGTTC CGGAATCTTA TCTGCGCTAT 
CTGGTCAACA GCTTGCGTGA GACCTTTGAT CTGGCAGGCA CGCCGATCCG GATCACGCTT 
CGCGAAAAAG CCAATCCGTT CGCGCATAAG CGCAAGCGCA AGTCATAG

Protein sequence

MSFTIAIIGR PNVGKSTLFN RLVGQKLALV DDEPGVTRDR REGQARLGDL DFTVIDTAGL 
DEGPRGSLTA RMQEQTEAAI AAADALMFVF DARAGLTPTD RSFADFARRA DKPVVLVANK 
SEGRHGDAGA LESYALGLGD PVGVSAEHDE GMSDLYDALR SVMPEPAEEV DEEEIVEPDM 
SRPIRVAIVG RPNAGKSTVI NYLLSEERLL TSPEAGTTRD SISVELNWKG RDFRIFDTAG 
LRRRSRIEAK LEKLSVADTL RAVRFAEAVV LMMDAQNRFE EQDLRIADLI EREGRALVIA 
VNKWDLMKGG SARIASLRND VDHWLPQIRG APVVAISGLT GEGIDRLMIA IQTAYAVWNR 
RVATALLNRW FQQAVAASPP PAVSGRRLKL NYATQTKARP PSFVVFCSRA DAVPESYLRY 
LVNSLRETFD LAGTPIRITL REKANPFAHK RKRKS