Gene Nham_1939 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nham_1939
Symbol
ID	4030542
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrobacter hamburgensis X14
Kingdom	Bacteria
Replicon accession	NC_007964
Strand	+
Start bp	2156321
End bp	2157445
Gene Length	1125 bp
Protein Length	374 aa
Translation table	11
GC content	62%
IMG OID	637970402
Product	transposase IS116/IS110/IS902
Protein accession	YP_577204
Protein GI	92117475
COG category	[L] Replication, recombination and repair
COG ID	[COG3547] Transposase and inactivated derivatives
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.143032
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGCTCCTGC CCTGCCAGCA AGCGAAGCTG GCAAGGGGCG CCAAAGACAA GGAGCACGCC 
ATGTCTCAGA CACCCAATAC CGCGATCGCC GTGATCGGCA TCGATATCGG CAAGAACTCG 
TTCCACGTCG TGGGCCACGA TGCGCGCGGC GCCATCGTGC TGCGGCAAAA GTGGTCGCGT 
GGCCAAGTGG AAGCGCGGCT CACCAATATA CCGCCTTGCC TGATCGGCAT GGAAGCCTGC 
GTCGGCGCAC ATCACCTGAG CCGCAACCTC GCATCGCTTG GTCACGATGC CAGGTTGATG 
CCGGCCAAAT ATGTCCGCCC CTATAGCAAG GGACAGAAGA ACGACTTCAA TGATGCCGAA 
GCGATTGCCG AAGCCGTGCA GCGCCCGACG ATGAAGTTCG TGGCGACCAA GACCGCGGAA 
CAACTGGATC TGCAGGCGCT GCATCGGGTG CGCGAGCGGC TGGTGTCGCA ACGCACCGGC 
CTCATCAACC AGATTCGCGC CTTCATGCTG GAACGCGGAA TCGCCGTGCG CCAGGGTATC 
GGCTTCCTGC GCACGGAACT GCCCACCATC CTTGCGACGC GCACTGATGC CCTGTCGCCA 
CGCATGTTGC GTGTCATCGA GGAGTTGGCA GGCGACTGGC GTCGGCTGGA TCAGCGCATC 
GATGGCCTAT CCGGCGAGAT CGAAGCACTG GCCCGTCAAG ATCAGGCATG TTCGCGCCTG 
ATGACGGTGC CTGGCATCGG ACCGATCATT TCGAGCGCCA TGGTGGCCGC GATCGGCACT 
GGAGACGTAT TCTCCAAAGG CCGCGACTTC GGCGCCTGGC TCGGACTGGT GCCCAAGCAG 
ATTTCGACGG GAGACCGCAC GATCCTCGGC CAAATCTCGA GGCGCGGCAA TCGCTACCTG 
CGCGTTCTAT TTGTGCAGGC GGCATGGGTT GTGCTGGTCA GGATAAAGAA CTGGGAACGT 
TACGGGCTCA AATCCTGGAT CGAAGCTGCC AAGAGGCGGT TGCACCACAA CGTGCTGGCG 
ATCGCGCTCG CCAACAAGCT TGCCCGCATC GCCTGGGCGG TGCTGGCTAA AGGACGCGCC 
TTCGAGTTGA CGAGGACCGA CGATGCAGGC GTCCGACCCG CTTGA

Protein sequence

MLLPCQQAKL ARGAKDKEHA MSQTPNTAIA VIGIDIGKNS FHVVGHDARG AIVLRQKWSR 
GQVEARLTNI PPCLIGMEAC VGAHHLSRNL ASLGHDARLM PAKYVRPYSK GQKNDFNDAE 
AIAEAVQRPT MKFVATKTAE QLDLQALHRV RERLVSQRTG LINQIRAFML ERGIAVRQGI 
GFLRTELPTI LATRTDALSP RMLRVIEELA GDWRRLDQRI DGLSGEIEAL ARQDQACSRL 
MTVPGIGPII SSAMVAAIGT GDVFSKGRDF GAWLGLVPKQ ISTGDRTILG QISRRGNRYL 
RVLFVQAAWV VLVRIKNWER YGLKSWIEAA KRRLHHNVLA IALANKLARI AWAVLAKGRA 
FELTRTDDAG VRPA