Gene Nwi_1544 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nwi_1544
Symbol
ID	3676372
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrobacter winogradskyi Nb-255
Kingdom	Bacteria
Replicon accession	NC_007406
Strand	-
Start bp	1689753
End bp	1691027
Gene Length	1275 bp
Protein Length	424 aa
Translation table	11
GC content	61%
IMG OID	637713099
Product	Phage portal protein, HK97
Protein accession	YP_318157
Protein GI	75675736
COG category	[S] Function unknown
COG ID	[COG4695] Phage-related protein
TIGRFAM ID	[TIGR01537] phage portal protein, HK97 family

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGCCTTT GGTCACGTAT ATTCGGGAGC GGTGCTTCTC CGGAACCGCG CGCCGCGATT 
CAACCGGCGG GCGGCGGCGT TGTCATCACG ACGTCGGAGC AGCTGGAAGA GGCGCTCCGC 
ACCGGCAATG TTACCGCGTC CGGCATGACG GTGACACCGG ACAAGGCGAT GCGCGCGTCG 
GCGGTGTATG CCTGCGTGCG CATTCGATCG GGCGTTCCGG CCAACATGCC GCTGCATATC 
AAGCGTAGGG TGGATGCTCG GACGCGGGAT GACGCTTCCG ATCATCCACT CTGGTCGATC 
TTCCGACGCC GGCCTAACCG TTGGCAGACG CCGTCTCAGT TCAAGCGGAT GATGACGGCG 
CACCTCTTGC TACGTGGGAA TGCCTACGCG CTAATCGTTC GATCTCGCGG CGCCGTGAAG 
GAGTTGATCC CGCTGCACCC CGATCGCGTT AAGTGCGAGC AGCTCGATAG CCTGGCGTTG 
GAGTATACCT ACACCCGCAA GGATGGCCGC CGGGTCGTGC TGACTCAGGC CGAGGTCTTT 
CACCTCGTTG GTCTGACGCT CGATGGCGTC CATGGCGTCT CCGTCATTAC CTATGCGCGC 
GAAACCATCG GCCTATCGCT GGCGCAGGAA GATCATGGCG CGACGGTGTT CAAGTATGGC 
GCTCGCCCGT CCACGGTGCT TGTTCACCCG AAAGCGCTAG GCCCGGAGGG CATCGAGAAT 
CTACGGTCGA GCCTCGATGA GTTCCGGGCT GGAGGCGATA AGGAGGGCAG GGCGCTGATC 
CTCGAAGAGG GGATAGAAGT TAAGCCCCTC GCTATGACGG CCGAAGACGC GCAATGGATC 
GAGAGCCGAA AGTTCTCACG TTCCGACATC GCCATGTTCT TCGGCGTACC GCCACACATG 
CTTGGCGACA CGGAAAAGAG CACAAGCTGG GGCACCGGCA TCGCATCGCA GACGCAGGGC 
TTCGTCACGT TCTGCGCGGA AGACGATCTG ACCACATGGG AAGAGACGAT CAACCGCGAC 
CTGATCGTCG ACAATGACAA CGATATCTAC GCCCGGTTCA ATCGGGCGTC GCTGGTCAAG 
GGCGACATCA AGATGCGCTG GGAAGCGCAT GTGAAGGCGC TTCAGTGGGG TGTGATGAGT 
CCGAATGAGG TTCGTGCGCT CGAAGACCTC AACCCGCGCG AGGGTGGCGA CATCTATTAT 
CCGCCTCCGA ATACCGCCGG CGGCGACGAC AAACCCGAAA AGGATGATGG CGATGAGTCT 
TCGCAAGCTG CCTGA

Protein sequence

MGLWSRIFGS GASPEPRAAI QPAGGGVVIT TSEQLEEALR TGNVTASGMT VTPDKAMRAS 
AVYACVRIRS GVPANMPLHI KRRVDARTRD DASDHPLWSI FRRRPNRWQT PSQFKRMMTA 
HLLLRGNAYA LIVRSRGAVK ELIPLHPDRV KCEQLDSLAL EYTYTRKDGR RVVLTQAEVF 
HLVGLTLDGV HGVSVITYAR ETIGLSLAQE DHGATVFKYG ARPSTVLVHP KALGPEGIEN 
LRSSLDEFRA GGDKEGRALI LEEGIEVKPL AMTAEDAQWI ESRKFSRSDI AMFFGVPPHM 
LGDTEKSTSW GTGIASQTQG FVTFCAEDDL TTWEETINRD LIVDNDNDIY ARFNRASLVK 
GDIKMRWEAH VKALQWGVMS PNEVRALEDL NPREGGDIYY PPPNTAGGDD KPEKDDGDES 
SQAA