Gene Nham_0203 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nham_0203
Symbol
ID	4030663
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrobacter hamburgensis X14
Kingdom	Bacteria
Replicon accession	NC_007964
Strand	+
Start bp	226878
End bp	228275
Gene Length	1398 bp
Protein Length	465 aa
Translation table	11
GC content	68%
IMG OID	637968738
Product	glycosyl transferase family protein
Protein accession	YP_575563
Protein GI	92115834
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1215] Glycosyltransferases, probably involved in cell wall biogenesis
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.678813
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGTCGTTTG TTGCGTGGGG GCGTGACTTG GCGGGGCGGG ACCAAGTTGA GGATGGCAGA 
TGGATCGCCG CACCGCGACG CGACCGGCCT GTGGAAGCGC CGCTCCCGGT CTGTCCTGCC 
GGCGTTTCTC ACATTCTGCA ATCGAGCAAC GACAACTGGC TGTGCGACCC GGAGCCGGGC 
CCGGCGAGCG AACTTGATTG CCTGCGACAC GTTCTCGCTC CGGCTCTGCT GCGCGCGGCC 
GAGGCGCGCG GCCGGGAGGT GGGGATCGGC GCGGATCAGG CGCTGATCCG GTCGGGCGTC 
ATCAATGAAG ACGCTTACCT GCAAACACTC TCCTCTCACA CCGGTCTTGC GATCGAGACA 
TGCGCAGAGG AATCCCGCGC CGATTGCCCC TTGCCCGATC GTCACCTGCC TGGCGCCGCG 
GAACACGGAC TGCTTCCGCT GCGCCGGGAT GGGAAGTTGA TCTGGGCGGT CGCACCGCGC 
GGTTTCGCCG CGCGACGGCT CTGCCGCCTG ACTGCTGCAT ATCCATCGCT ATGCGACCGG 
GTGCGTCTGA CATCGACGCG AGACCTCAAT CAGTTTCTGC TGCGGCAGAC CGGCGACGTG 
CTCGGCCAGT CCGCCGCCAA TGCGCTCGGT CGGCGATTCC CGGCGCTGTC CGCCGCGCCG 
GTTGCCGACG GTGCCCCCGG CGGGCTGCGG ACAATGCGGC GCCCCGCGCA GACCGGCGCT 
CTCGCCGTCA TGATGGTGCT GACGCCAACC TTCGCCCTGG ACATCTTGAG CGACGCGCTG 
GCGATATGGT TTCTCGCATT CATCAGCCTG CGGCTTGCGG CCAGCCTGAG ACCGCCGCGC 
CCGGCGGTGC GGCTGCCGCG TGTCCCGGAC GGCCGTCTGC CGACCTACAC CGTGATCGCG 
GCGCTGTATC GCGAAGCGGC ATCGGTCGCA CCGCTGATGC AGGCCATCGG CGCCCTGGAC 
TACCCGCGCG AAAAGCTCGA CGTCATCATC GTGATCGAGC TCGACGATCT CGAAACCCGC 
GCCGCTCTTG CGAGGCTCGG CCCGATGCCG CAGGTTCAGG TCCTGCTCGC CTCGGCGGAA 
GGGCCGCGCA CCAAACCGAA GGCGCTGAAT TGCGCGCTGC CGTTCGCGCG CGGCAGCTTC 
ACCGCCGTGT TCGATGCCGA GGACCGTCCC GATCCGGGCC AGCTCCGCGC CGCGCTCGAC 
GCCTTTCGCA TTCAAGGCAC GGACGTGGCC TGCGCTCAGG CCAGTCTCTG CATCGAAAAC 
CAGTCCGACA GCTGGCTCTC GCGCATGTTC GCCGCCGAAT ATGCCGGACA GTTCGACGTC 
TTTCTTCCGG GACTCGCATC ATTCGGGGTG CCGCTGCCGC TCGGCGGATC GTCGAACCAC 
TTCCGCGGTA TTAGGTAG

Protein sequence

MSFVAWGRDL AGRDQVEDGR WIAAPRRDRP VEAPLPVCPA GVSHILQSSN DNWLCDPEPG 
PASELDCLRH VLAPALLRAA EARGREVGIG ADQALIRSGV INEDAYLQTL SSHTGLAIET 
CAEESRADCP LPDRHLPGAA EHGLLPLRRD GKLIWAVAPR GFAARRLCRL TAAYPSLCDR 
VRLTSTRDLN QFLLRQTGDV LGQSAANALG RRFPALSAAP VADGAPGGLR TMRRPAQTGA 
LAVMMVLTPT FALDILSDAL AIWFLAFISL RLAASLRPPR PAVRLPRVPD GRLPTYTVIA 
ALYREAASVA PLMQAIGALD YPREKLDVII VIELDDLETR AALARLGPMP QVQVLLASAE 
GPRTKPKALN CALPFARGSF TAVFDAEDRP DPGQLRAALD AFRIQGTDVA CAQASLCIEN 
QSDSWLSRMF AAEYAGQFDV FLPGLASFGV PLPLGGSSNH FRGIR