Gene Nham_1410 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nham_1410
Symbol
ID	4032328
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrobacter hamburgensis X14
Kingdom	Bacteria
Replicon accession	NC_007964
Strand	+
Start bp	1596648
End bp	1597823
Gene Length	1176 bp
Protein Length	391 aa
Translation table	11
GC content	67%
IMG OID	637969884
Product	Phage portal protein, HK97
Protein accession	YP_576692
Protein GI	92116963
COG category	[S] Function unknown
COG ID	[COG4695] Phage-related protein
TIGRFAM ID	[TIGR01537] phage portal protein, HK97 family

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGCTTGC GCCTGAAAAA TCTTTTCACC CCACCCGAGA CCAAAGCCAG CCGCACCGCA 
AAGCTGCTTG CGTTCGAGAG CGGCCGCCGC GCGCGGTGGA CGCCGCGCGA CTATGCGGCG 
CTGGCGCGCG AGGGCTATCT TAATAACGCC ATCGTGCATC GCGCGGTCCG GTTGATCGCG 
GAGAACGTGG CGTCGTGCAG CTACCTCGTG TTCGAGGGGG CGCAGGAGCA CGAGGCGCAT 
CCGCTCTCGC TCCTGCTGTC GCGGCCGAAC GCGCGGCAGG ACGGCGGTGC ATTCCTCGAG 
ATGCTGGTGT CGCATCTGCT GTTGGCCGGC AACGCTTATG TCGAGGTGGT CGCGCTCGAC 
GGCGCGGTGC GCGAGCTTTA CGCGCTACGG CCCGATCGCA TGAAGGTGGT GCCCGGTCCC 
GACGGCTGGG CGGAGGCATA TGAATATAGC GTCGGCGGGC GCAGCGTGCG CTTCGATCAG 
GCGTCATCCG CCGTGCCGCC GATCCTGCAC CTGACATTCT TTCATCCGCT CGACGATCAC 
TATGGTCTCG CGCCGATCGA ACCGGCGGCG GTCGCCATCG ACACCCATAA CGCCGGATCG 
ACGTGGAACA AGGCGTTGCT TGATAACGCG GCGCGGCCCT CGGGCGCGCT GGTCTATTCC 
GGGCCGGAAG GAGCGGTGTT GTCGGATTCG CAGTTCGACC GGCTCAAGCG CGAAATGACC 
GATACCTATC AGGGCGCGGT GAACGCGGGC CGGCCGCTGC TGCTCGAAGG CGGGCTCGAC 
TGGAAGGCGA TGTCGCTGAC GCCGAAGGAC ATGGATTTCC TCGAGGCCAA GCACACCGCC 
GCGCGCGAGA TCGCGCTCGC CTTCGGCGTG CCGCCGATGG TGCTCGGTAT TCCCGGCGAC 
AACACCTATG CGAATTTCCA GGAGGCCAAC CGCTGCTTCT TCCGCCAGAC CGTGCTGCCG 
TTGGCGTCGC GGATCGGCAA TTCGTTCGCG CAGTGGCTGT CGCCTCAGTT CGGCGACGCC 
ATCCGCATCG TCGTGGATCC CGACAGGATC GACGCGCTCG CCACCGACCG CGCCGCGCTG 
TGGCAGCGCG TCAGCAACGC GGCGTATCTC ACGCTCAACG AAAAGCGCGA GGCGGTCGGC 
TACGCGCCGA TCGAGGGCGG CGACCGGCTG GAGTGA

Protein sequence

MRLRLKNLFT PPETKASRTA KLLAFESGRR ARWTPRDYAA LAREGYLNNA IVHRAVRLIA 
ENVASCSYLV FEGAQEHEAH PLSLLLSRPN ARQDGGAFLE MLVSHLLLAG NAYVEVVALD 
GAVRELYALR PDRMKVVPGP DGWAEAYEYS VGGRSVRFDQ ASSAVPPILH LTFFHPLDDH 
YGLAPIEPAA VAIDTHNAGS TWNKALLDNA ARPSGALVYS GPEGAVLSDS QFDRLKREMT 
DTYQGAVNAG RPLLLEGGLD WKAMSLTPKD MDFLEAKHTA AREIALAFGV PPMVLGIPGD 
NTYANFQEAN RCFFRQTVLP LASRIGNSFA QWLSPQFGDA IRIVVDPDRI DALATDRAAL 
WQRVSNAAYL TLNEKREAVG YAPIEGGDRL E