Gene Nham_2014 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nham_2014
Symbol
ID	4031395
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrobacter hamburgensis X14
Kingdom	Bacteria
Replicon accession	NC_007964
Strand	+
Start bp	2241144
End bp	2242394
Gene Length	1251 bp
Protein Length	416 aa
Translation table	11
GC content	61%
IMG OID	637970471
Product	phage integrase
Protein accession	YP_577272
Protein GI	92117543
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGGTATT TTTCGATGCT AACGGATACT GCGATCAGGA AGGCAAAACC GGGCGACAAG 
CCCTTCAAGA TGGCCGACTC TGGTGGCCTT CACCTCTATG TCTCGACCGC GGGCGGCAAG 
CTTTGGCGAT TCCGCTATCG GTACGCCGAC AAAGAAAAGC TCCTCACTAT CGGTCCTTAC 
CCGGATATCA GCCTCGTTGA TGCCCGTGCG GCCCGAGACG CCGCCAAGGC ATCCTTGCGC 
GACGGCCGCG ATCCCGGCGT CATCAAGAAA CTGCGGAAGC TCGCCAACGT CACCAGCACC 
GCCAACACGT TCGAAGCGAT CGCCCGCGAA TGGTACGACC TGAATAAGGG CCAATGGGTC 
GAGCGCCATG CCGACGATGT ACTCACCAGC CTTGAGCGCG AAGTCTTCCC TGTGCTCGGC 
AATATCCCTG TGGCCGATAT CAAGGCGCCC GAAGTCTTGG CTGTGCTGCG CGGTATCGAG 
GCTCGCGCGA AGGAAACGGC GCGGCGAGTC CGGCAGCGCA TGTCGGCGGT GTTCGTCTAC 
GCAATCAGCT CGGGCCGCGC CGACGCCGAT CCGGCCGCGA CCGTCCAGAA GGCCATGGCT 
CCGATGGTCA AGGGACGCCA GCCTGCCATT ACCGATCTGG ATGCCGCCCG CGAGATGCTG 
GGGAAAGCCG AAGCCGAGAA AGCGCATCCA GCTACAAAGC TAGCCCTACG AATTATTGCC 
CTGACTGTCG TTCGTCCGGG AACGCTCATC ACCACGCCAT GGTCGGAGTG GACCGATATG 
GAAGATGGCG TCTGGCGCAT CCCGGCGGCG CGGATGAAAC TGCGGCTGCA ACACAAGGAT 
GATGATGCTC GGGACCATTG GGTGCCGCTA TCAAGGCAAG CCTTGGAGGC TGTCGAAGCG 
CTGCGCACCC TGACCGGCCG CGGTCCGATC CCCTTCCCGA ACACCCGCCA CGCGCACAGG 
ACCATGTCAG AGAACGCCAT CGGGTATCTG TTGAACCGTG CGGGGTATCA CCACCGCCAT 
GTCCCCCACG GATGGCGGGC AACATTTTCC AGCGTGATGA ATGAGCGGTT TCCGGCTGAC 
AAACCGATTA TCGACCTGAT GCTGGCTCAC GTCCCGAAGG ACAAGGTCGA AGGTGCTTAC 
AATCGCGCCC TGCATCTGGA ACGCCGCCGA AAGTTGGCGC AGGAATGGGC GGACTTGATC 
TTGAAGGATG CGCGGCCCGC TGCTGATTTG CTGGTCGGAC CGAGGAAGTA G

Protein sequence

MGYFSMLTDT AIRKAKPGDK PFKMADSGGL HLYVSTAGGK LWRFRYRYAD KEKLLTIGPY 
PDISLVDARA ARDAAKASLR DGRDPGVIKK LRKLANVTST ANTFEAIARE WYDLNKGQWV 
ERHADDVLTS LEREVFPVLG NIPVADIKAP EVLAVLRGIE ARAKETARRV RQRMSAVFVY 
AISSGRADAD PAATVQKAMA PMVKGRQPAI TDLDAAREML GKAEAEKAHP ATKLALRIIA 
LTVVRPGTLI TTPWSEWTDM EDGVWRIPAA RMKLRLQHKD DDARDHWVPL SRQALEAVEA 
LRTLTGRGPI PFPNTRHAHR TMSENAIGYL LNRAGYHHRH VPHGWRATFS SVMNERFPAD 
KPIIDLMLAH VPKDKVEGAY NRALHLERRR KLAQEWADLI LKDARPAADL LVGPRK