Gene Nham_4368 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nham_4368
Symbol
ID	4025228
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrobacter hamburgensis X14
Kingdom	Bacteria
Replicon accession	NC_007960
Strand	-
Start bp	17002
End bp	18123
Gene Length	1122 bp
Protein Length	373 aa
Translation table	11
GC content	59%
IMG OID	637964883
Product	glycosidase, PH1107-related
Protein accession	YP_571791
Protein GI	92109504
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2152] Predicted glycosylase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTGATT TCCAATTGCG GCGTCTTGGA CTGTTGATGG AACCGGAGCC AGGTAATCCT 
CTGGAAGCCG AAGGCGTCCT GAACCCAGCC GCCGCGCGTG GTCCGGACGG TCAGCTTTAC 
CTTTTTCCGC GGCTGGTCGC GCGGGGTAAC CACTCCCGCA TCGGTATAGC GCGGGTTTTG 
TTCAATGAGA TCGGTGATCC GGTCGGGGTC GAGCGACTCG GTATCGCACT TGAACCTGAA 
ATGGATTACG AACTGCGGTC GGACGGTACC GGCGGCTGCG AAGATCCGCG TATCACGTTT 
GTCGAGCCGC TCCGACGTTA CGTCATGACT TACACTGCGC ATTCCCCGAA CGGCCCACGG 
ATCGCGCTGG CAATATCCGA AAACTTGTTC CGCTGGCAAC GCCTGGGGTT GGCTACCTTC 
CGACCGTATG AGGGCATTGA GTTCGAAGGC GTGGACAACA AGGACGCCAG CGTCTTCCCT 
GTCGCTATAC CAGATCCATC GGGACAGCTC TCAATGGCCA TCCTACAGCG GCCGTTGTTT 
CCAGGAACAC GCCCGGAGGA AACGTTACGC CGTCCTGGGT CCGGCTTGGT GGATCTCGAC 
CGCGAAAGCA TCTGGATTTC CTATTGCTCG ACGGCCCTGG CAGACTGTGA ACCCTTTCAT 
CTCAGTCATT TCGGCTCGCA TCACCGCCTG GCCGCCCCAA TGGCTGCCTG GGAACGGCTT 
AAAATCGGCG GTGGTACCCC ACCCATCCTG ACCCGTCACG GTTGGCTGAC AATTTACCAC 
GGCGTCAGCG AGCTTTCGGC CGCTCCCGGG TTTCCACGCA AGCTGCTGTG TTACTCGGCT 
GGAGTGCTGG TGCTTTCGGA GGAGCATCCT CAAGTTATTC GCTTTCGTTC GCCGGAGCCG 
GTGCTGATAC CGGAATTGCC GCAGGAACGC CAAGGGATCG TCGCCAACGT CGTATTCCCC 
ACCGGCATCG ATCGGCGAGA CGATCTCGGG TCACCCGATC GCTTCGACGT TTACTATGGG 
ATGGCAGACA ACCGGATCGG TGTGGCGAGA CTCGACATAC CGAAGCACCT ACCGTCAGAT 
GGGCTGAAGG ATCTGCCACC AGTGAAGCTT TTAGAACTTT AA

Protein sequence

MSDFQLRRLG LLMEPEPGNP LEAEGVLNPA AARGPDGQLY LFPRLVARGN HSRIGIARVL 
FNEIGDPVGV ERLGIALEPE MDYELRSDGT GGCEDPRITF VEPLRRYVMT YTAHSPNGPR 
IALAISENLF RWQRLGLATF RPYEGIEFEG VDNKDASVFP VAIPDPSGQL SMAILQRPLF 
PGTRPEETLR RPGSGLVDLD RESIWISYCS TALADCEPFH LSHFGSHHRL AAPMAAWERL 
KIGGGTPPIL TRHGWLTIYH GVSELSAAPG FPRKLLCYSA GVLVLSEEHP QVIRFRSPEP 
VLIPELPQER QGIVANVVFP TGIDRRDDLG SPDRFDVYYG MADNRIGVAR LDIPKHLPSD 
GLKDLPPVKL LEL