Gene Nham_2001 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nham_2001
Symbol
ID	4031554
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrobacter hamburgensis X14
Kingdom	Bacteria
Replicon accession	NC_007964
Strand	+
Start bp	2224866
End bp	2226197
Gene Length	1332 bp
Protein Length	443 aa
Translation table	11
GC content	63%
IMG OID	637970458
Product	hypothetical protein
Protein accession	YP_577260
Protein GI	92117531
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.0214645
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCAAGG CGCCCAAGAC CATAAAGCCA AAGGAACGGG ATACGATCAT CCAGGCGCTG 
AGCGCCGGGG TCGTGCCGCG CCTCGGACTG GCGCACATCC AGGTCGGACG AGCCGCCGAA 
ATCGGGGCGT TGCTGCGCGA CGTCGACCGG ATCGCCGACG GCGGGGCCGC CGTCAGGTTC 
GTGATCGGCG AGTACGGCGC CGGCAAGACG TTCTTCGCGA ACCTCATCCG GCTGATCGCG 
CTGGAGCGCA AATGCGTCAC CGTGCATGCG GATCTCGCGC CCGACAGGCG CATCCACGCC 
AGTGGTGGCC AGGCGAGGGC GCTCTATTCG GAGGCCGTCC GGAATATGGC CACGCGGACC 
AAGCCGGAGG GCGGAGCCCT TGCGGCGATC GTCGAGCGCC TCGTCACCGA TGCGGTTAAG 
GAGGCGGGCG AGCGCCAGGT CTCGGTCGAA AATGTCATCG ACGAGAAGCT GGCGCCGATC 
CAGGAATTCG TCGGCGGCTA CGACTTCGCG ACGGTCCTGA AGGCCTACTG GCGGGGAAGC 
GAGACGTCGA ACGAAGAGCT CAAGATCGCC GCGCTTCGTT GGCTTCGCGG CGAATTTTCG 
ACGAAGACCG AAGCACGGCA GCTTCTCGGC GTCCGGACAA TCATCGACGA CGACAGCGTA 
TACGACTCAT TGAAGTCGCT CGCTTGTCTG ACCAAGATGG CCGGGTACGC CGGGTTGCTC 
GTCATGTTCG ACGAGATGGT CAATATTTAC AAACTTCAGA ACTCCCAAGC GCGAAACCAG 
AATTTCGAGC AGATACTTCG CATCGTGAAC GACTCCCTGC AGGGCAACAC GTCGAACATC 
GGGTTCATGA TGTGCGGAAC GCCCGAGTTC CTCATGGACA CCAGGCGCGG TCTCTATAGC 
TACGAGGCAC TGCAATCGCG TCTGGCGGAG AACCGTTTCG CGGTGGGAGG CTTAGTCGAT 
CATTCGGGCC CCGTCATGAA GCTGCAAAGC CTCACGCCGG AAGATCTTCT GGTTCTCCTG 
TCGAATATCC TGATGGTCTT CGCCGCCGGG GACCCGTCGA AGAACCTCGT ACCTGACGAG 
GCGCTGCCGG CGTTCATGGA GCAATGCGAC CAGAAGATCG GCGAGGCGTA TTTCCGGACA 
CCGCGGACGA CCGTGAAGGC CTTCGTGCAA ATGCTGTCCG TCCTCGAACA AAATCCAGAC 
GCGAAGTGGC AGGACCTTCT GGGGCAGGTG CAGGTTTCGG CGGACCCGCA CGCCGACGAG 
GAGGCCGCCC CCGAGGGCGA TCAGCAGACC GGAGACGGCG ATGAGCTCAC CAGCCTCCGC 
ATCGGGGCTT GA

Protein sequence

MSKAPKTIKP KERDTIIQAL SAGVVPRLGL AHIQVGRAAE IGALLRDVDR IADGGAAVRF 
VIGEYGAGKT FFANLIRLIA LERKCVTVHA DLAPDRRIHA SGGQARALYS EAVRNMATRT 
KPEGGALAAI VERLVTDAVK EAGERQVSVE NVIDEKLAPI QEFVGGYDFA TVLKAYWRGS 
ETSNEELKIA ALRWLRGEFS TKTEARQLLG VRTIIDDDSV YDSLKSLACL TKMAGYAGLL 
VMFDEMVNIY KLQNSQARNQ NFEQILRIVN DSLQGNTSNI GFMMCGTPEF LMDTRRGLYS 
YEALQSRLAE NRFAVGGLVD HSGPVMKLQS LTPEDLLVLL SNILMVFAAG DPSKNLVPDE 
ALPAFMEQCD QKIGEAYFRT PRTTVKAFVQ MLSVLEQNPD AKWQDLLGQV QVSADPHADE 
EAAPEGDQQT GDGDELTSLR IGA