Gene Nwi_1628 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nwi_1628
Symbol
ID	3675420
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrobacter winogradskyi Nb-255
Kingdom	Bacteria
Replicon accession	NC_007406
Strand	-
Start bp	1771955
End bp	1773133
Gene Length	1179 bp
Protein Length	392 aa
Translation table	11
GC content	61%
IMG OID	637713186
Product	Phage portal protein, HK97
Protein accession	YP_318241
Protein GI	75675820
COG category	[S] Function unknown
COG ID	[COG4695] Phage-related protein
TIGRFAM ID	[TIGR01537] phage portal protein, HK97 family

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.220321
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAACTCT GGCCCTTCCG CCGCACTACT ATTGAAACCA AATCGCTCGC CGATCCGGAT 
GAAGCGATCT TCGCAATTCT CTCGGGCGGC AGCACGTACG GGCCGGTTCA TCCTCTCTCA 
GAACCCGCTG TTTCCGCAGC CGTCACGACG ATCAGCAATG CTGCGGCAAC GCTCGATTTA 
CACCTGGTCA AACGCGACGA CACGTCCGCC GACGTAAAAC ACCCCGCACT CGACCTGTTG 
CGCGGTCACG TCAACGAATG GACATCCGGC TCCGACCTGA TCCGAGACCT TATCACACAA 
GCACTAACCG CCGACGCCGG CGGGATTGCC TGGGTCAACA AAAGCGGCGA CGGCCGACCC 
CTTGAAATTA TCCGGTATAC CGCGGGCCGC ATCACCGTCG AGTATGCCGG CGACGGCTCC 
GGTCGCCCAT CCTACACCGT CAACGGTCGC AGCGTGCCGG CGTCGGACGT CGTTCACATT 
CGCGGCCCAT TCTCGAAATG CCCGGTCAGT CTTGCCTATC CGACAATCTC CGCCGCAGTG 
GCGATGTCGC GTTATGTCGA ATTCCTCTTC AAGCGGATGG CGCGTCCCGG CGGCGTTGTC 
GAAGTGCCGA CCGGCGCGGG CGAAAAGGCC GTCCAGAACA TGATCGCGGG CTGGAACGCG 
GCTTACGGCG GCGCGGACAA CGCCGGCGGC ACCGCATTCC TGTTTGACGG TGCGACGTTC 
AAGCAGATCG CACTTGCATC GACCGACGCT CAGTTCGTCG AAAACCGCCG ATGGCAACTG 
GAAGACATCG CGCGCGCATT CAACATTTCG AGCGTCATGC TCGGTGACCT CACAAAATCG 
AGCTACGCCA ATGCATGGCA AAAATACAGA GAGTTCCTGA GCGTCACGCT GATGCCGTGG 
CTCAAGGCGC TTGAATCTGC GTTCGACCGC GCGCTGCTGA CTGATGACGA GCGGGCGCTG 
TACGCGTTCA AGTTCGACAT TGATGACCTG ACACGCGTGG ACCTGGAGAA GCGTGCGACC 
GCCATTTCCA GCCTCGTTGC CAGTCGCGTG CTCAATCCAA ACGAAGCCCG CACATGGCTG 
GATACCGGCC TTGCGCCTTA TGCCGGCGGC AACGAATTTG CCAACCCGAA CACCGGCGCC 
AGCCAGCCTG GATCGCAGGA GCAGCCCGTA AATGACTGA

Protein sequence

MKLWPFRRTT IETKSLADPD EAIFAILSGG STYGPVHPLS EPAVSAAVTT ISNAAATLDL 
HLVKRDDTSA DVKHPALDLL RGHVNEWTSG SDLIRDLITQ ALTADAGGIA WVNKSGDGRP 
LEIIRYTAGR ITVEYAGDGS GRPSYTVNGR SVPASDVVHI RGPFSKCPVS LAYPTISAAV 
AMSRYVEFLF KRMARPGGVV EVPTGAGEKA VQNMIAGWNA AYGGADNAGG TAFLFDGATF 
KQIALASTDA QFVENRRWQL EDIARAFNIS SVMLGDLTKS SYANAWQKYR EFLSVTLMPW 
LKALESAFDR ALLTDDERAL YAFKFDIDDL TRVDLEKRAT AISSLVASRV LNPNEARTWL 
DTGLAPYAGG NEFANPNTGA SQPGSQEQPV ND