Gene Nham_1030 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nham_1030
Symbol
ID	4032373
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrobacter hamburgensis X14
Kingdom	Bacteria
Replicon accession	NC_007964
Strand	-
Start bp	1151999
End bp	1152955
Gene Length	957 bp
Protein Length	318 aa
Translation table	11
GC content	67%
IMG OID	637969528
Product	peptidase S1 and S6, chymotrypsin/Hap
Protein accession	YP_576338
Protein GI	92116609
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0265] Trypsin-like serine proteases, typically periplasmic, contain C-terminal PDZ domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.652034
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCTCTAC CCGCGCCCGA ACCGCAGCCG GATGACTCCC GCCTGCTCGA TAGCTATTCC 
GCCACCGTCA CCGACGCCGT CGACCGTATC GGTCCAGCCG TGTGCCGGAT CGAACCCGTT 
GGCGCCCACC GCGATGCCGG ACTAGGCTCC GGCTTCGTCA TCGCGCCGGA CGGTTTGATC 
GTCACCAATT TCCATGTTGT CGGCGATGCG CGCGCTGTGC GCGTCGCCAC GCCTGATGGC 
GCGTCCACAG AAGGTCGGGT GCTCGGTCGC GACCCCGACA CCGACGTCGC GTTGGTGCGC 
GCAGACGGGC ATTTCTCCGA CATCGCACCA CTCGGCGATT CCGGGCGCCT CCGCCGCGGC 
CAGATCGCCA TTGCCATCGG CAATCCGCTC GGCTTTGAGT GGACGGTGAC GGCCGGCGTC 
GTCTCGGCGC TAGGCCGCTC CATGCGCGCC TCGACCGGAC GACTGATCGA CGACGTGATC 
CAGACCGACG CCGCGCTCAA TCCCGGCAAT TCCGGCGGCC CCCTGGTCTC GTCGGCAGGC 
GAGGTGATCG GCGTCAACAC CGCCATGATC CGCGGCGCGC AAGGCATCGC CTTCGCCGTC 
GCTTCCAACA CCGCCAGTTT CGTCATTGCC GAAATCATCC GCTTCGGCCA TGTGCGCCGC 
GCCTTCATTG GCGTCTCGGC CGACACGGTC GTGTTGCCGC GCCGCGCCGC GCTGATGTCG 
CAAGTGACGA GCCGTACTGC CGTGCGGTTG CACTCGATCG AGGCGCATGC GCCTGCGGCA 
AAAGCCGGCC TGAAGGAAGG CGACATCATC GCGGCGATAG ACGGCCGTGC CGTTGGCGGA 
GTGGACGATC TGGTACGCAT GCTCACCGCT GAAAGGATCG ACAGGGAAAC GGTGTTTACA 
GTAGTCGGCC GCGCTGGGGT CAGGCAGATA ACAGTAATTC CAACGGCGCG CCGCTGA

Protein sequence

MALPAPEPQP DDSRLLDSYS ATVTDAVDRI GPAVCRIEPV GAHRDAGLGS GFVIAPDGLI 
VTNFHVVGDA RAVRVATPDG ASTEGRVLGR DPDTDVALVR ADGHFSDIAP LGDSGRLRRG 
QIAIAIGNPL GFEWTVTAGV VSALGRSMRA STGRLIDDVI QTDAALNPGN SGGPLVSSAG 
EVIGVNTAMI RGAQGIAFAV ASNTASFVIA EIIRFGHVRR AFIGVSADTV VLPRRAALMS 
QVTSRTAVRL HSIEAHAPAA KAGLKEGDII AAIDGRAVGG VDDLVRMLTA ERIDRETVFT 
VVGRAGVRQI TVIPTARR