Gene Nham_0047 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nham_0047
Symbol
ID	4029757
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrobacter hamburgensis X14
Kingdom	Bacteria
Replicon accession	NC_007964
Strand	+
Start bp	51840
End bp	53186
Gene Length	1347 bp
Protein Length	448 aa
Translation table	11
GC content	68%
IMG OID	637968580
Product	peptidoglycan binding domain-containing protein
Protein accession	YP_575408
Protein GI	92115679
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGAGCGA CGATCGCCGC GGCATTGATG ATCGTGACCA CCGCGATTTA CGCCGAGGCG 
CAGCCCGCCG GCACCAATGG GCGCGCCGGG ACGAAGCCGT CCCCACCGGC CCACCCCGCG 
GTGCAAACTC CAGCCGATAC CGCGAGCGCG ATGACGCAGG CGGCGCGGCA GGCGCTGCAG 
TCTGACCTGG CATGGACCGG TCACTATAAC GGCATCATCA ACGGCGAGGT CAGCGACCGG 
CTGATCGCTG CGATCAAGGC GTTCCAGAAG GATCAGGGCG GCAAGCAGAC CGGCGTGCTC 
AACCCGCAGG AACGCGGCGC GCTCGCCTCG GTCGCGCGGA AATCGCGGAG CAATGTCGGC 
TGGAAGACGG TGAGCGATGC CAGCACCGGC GTTCGGCTCG GCCTGCCGGC CCGGCTGGTG 
CCGCAGCGCT CGAGCGAGGG CGACGACACC AAATGGAGTT CGTCCACCGG CACCATCCAG 
ATCCTGCTGA CGCGCCGCAA GGACGCCGAC CTCACGACCG CGAAACTCGC CGAGCACGAA 
CGAAAGCAGC CCGCCGGCCG CAAGATCGCC TACAGCGCGA TCAAGCCGGA TGTCTTCGTG 
CTCTCGGGCA CGCAGGGCCT GAAGAAATTC TACACGCGCG GCCAACTCCG CGGCAACGAG 
GCGCGCATCC TGACCGTCCT CTACGATCAG GCCACCGAAG GCACCATGGA GCCCGTGGTG 
ATCGCGATGT CGAGCGCGTT CGACCCGTTC CCCGCGAACG GTCCGCCGCC GCGCAAGATC 
GTGGAATACG CAACGGGCGT GACCGTCAGC CGCGACGGCG CGATCCTCAC CGGTGGCGAC 
GTCACCGACG GATGCAAATC GATTGTCGTC GCGGGCCACG GCAACGCCGA CAGGATCGCC 
GACGACAAGG ATCACGGCCT CGCCCTGCTG CGCATCTACG GCGCGCACGG ATTGCAGCCG 
ATCGCGCTCG ATGGCGGCGC GACCAAAGGC GGTCTCGCAC TTGTCGGCAT CGCAGACCCG 
CAAAACCAGG GCGGCGGCGC GGCCGTGAGC CAGGTCAAGG CATCGGTTGC GCAAGGAGCG 
GACGGCGGCG AACCGGCGCT GTCGCCGGCG CCCGCATTGG GCTTTTCCGG CGCAGCGGCG 
CTCGATACCA ACGGAAAGTT CGCGGGCCTT GCGCTACTGA AGCCGACGGA CGTCGCCGGG 
CTTTCGGGTT CGGCGCCCGC AGCGCAGGCC GTGCTCGCAC CAGTCGAGGC CGTGCAGGCC 
TTTCTGAAAG CGAACAAAGT GACGCCTGCA AGCGGATCAT CCAACGCGAA TGCCGCGGTG 
GTCCGCGTCA TCTGTGTGCG GAAGTAA

Protein sequence

MRATIAAALM IVTTAIYAEA QPAGTNGRAG TKPSPPAHPA VQTPADTASA MTQAARQALQ 
SDLAWTGHYN GIINGEVSDR LIAAIKAFQK DQGGKQTGVL NPQERGALAS VARKSRSNVG 
WKTVSDASTG VRLGLPARLV PQRSSEGDDT KWSSSTGTIQ ILLTRRKDAD LTTAKLAEHE 
RKQPAGRKIA YSAIKPDVFV LSGTQGLKKF YTRGQLRGNE ARILTVLYDQ ATEGTMEPVV 
IAMSSAFDPF PANGPPPRKI VEYATGVTVS RDGAILTGGD VTDGCKSIVV AGHGNADRIA 
DDKDHGLALL RIYGAHGLQP IALDGGATKG GLALVGIADP QNQGGGAAVS QVKASVAQGA 
DGGEPALSPA PALGFSGAAA LDTNGKFAGL ALLKPTDVAG LSGSAPAAQA VLAPVEAVQA 
FLKANKVTPA SGSSNANAAV VRVICVRK