Gene Sare_4255 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_4255
Symbol
ID	5704387
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	-
Start bp	4828304
End bp	4829674
Gene Length	1371 bp
Protein Length	456 aa
Translation table	11
GC content	68%
IMG OID	641273674
Product	nitrite transporter
Protein accession	YP_001539027
Protein GI	159039774
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG2223] Nitrate/nitrite transporter
TIGRFAM ID	[TIGR00886] nitrite extrusion protein (nitrite facilitator)

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.823889
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.00256557
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGACGACGA CGAGCGTGCC CGCCACGACG GGGGACGAGG AGATCGACCT GCAACGCCGG 
AAGGGTCGCT GGATCGGCTA CTGGGCGCCC GAGGACGACC GCTTCTGGCG GACCGCCGGC 
CGGGCCGTCG CCCGGCGCAA CCTCATCTAC TCGATCTTCG CCGAGCACAT CGGGTTCTCC 
GTCTGGCTGC TCTGGAGCAT CGTGGTGGTC CGGTTGGACG ACGTCGGATG GACGCTGACG 
ACCAGCCAGG CGCTCTGGCT GACTGCCGTG CCCAGCGGTG TCGGCGCGCT GCTGCGACTG 
CCCTATACCT TCGCCGTGCC GATTTTCGGC GGCCGGAACT GGACCGTCAT CTCCGCGCTG 
CTGCTGATCA TCCCGTGTGC CGGGCTGGCG TGGGCGGTCC AGCATCCGGA AATCGGGTTC 
ATGCCGCTGC TGCTGATCGC CGCCACCGCC GGCCTCGGCG GCGGTAACTT CGCCTCCAGC 
ATGGCGAACA TCTCGTTCTT CTACCCCGAG CGGGAGAAGG GGTGGGCGCT CGGGTTGAAC 
GCGGCCGGCG GCAACATCGG TGTCGCCGTG GTGCAGTTCC TGGTGCCTCA GGTGATCGTG 
CTCGGTGGCG GCCTGGCGTT GGCCAGGGCC GGGCTGATGT ACCTTCCGCT CGCGGTGATC 
GCCGCGGTCT GCGCCTTTCT GTTCATGGAC AACCTGGTCG AGGCCAAGGC GGACGTGGGA 
TCGGTGTGGT CCTCGTTGCG GCACCGGGAC ACGTGGATCA TGTCATTGCT GTACATCGGT 
ACGTTTGGTT CCTTCATCGG CTACTCGGCG GCCTTTCCGA CGTTGCTCAA CGGGGTGTTC 
GGCCGACCCG ACATCGCGCT GTCCTGGGCG TTCCTCGGTG CGGCAGTGGG CTCGGTCTGC 
CGACCCTTCG GGGGCCGCCT CGCGGACGCC ATCGGTGGCG CCCGGGTCAC CGTGGCCAGC 
TTCGTGCTGA TGACCGGCGG TGCCTACCTG GCCCTGTGGT CGGTGCGGGA ACGCTGGCTG 
GGAGTCTTCT TCCTGGCGTT CATGCTGCTG TTCGTGGCCA CCGGGGTCGG CAACGGGTCG 
ACGTACCGGA TGATCTCCCG GATCTTCCAG GTGCAGGGGG AGAAACTCGG CGGCTCACCG 
GAGATCATGC GGGCGATGCG CCGGCAGGCA GCCGGGGCAC TCGGAATCAT CTCCGCGGTC 
GGTGCCTTCG GCGGGTTCCT GGTCCCGATC TGCTACGCAT GGGCGAAGTC GGCCTACGGC 
AGCATCGAGC CCGCGCTGTG GTTCTATGTC GGCTTCTTCC TGGTGCTGAC GGTGCTGACG 
TGGGGGGTGT ATCTGCGACC GGGGGCGCGG CTGACCGGGG ATCGGGTGTG A

Protein sequence

MTTTSVPATT GDEEIDLQRR KGRWIGYWAP EDDRFWRTAG RAVARRNLIY SIFAEHIGFS 
VWLLWSIVVV RLDDVGWTLT TSQALWLTAV PSGVGALLRL PYTFAVPIFG GRNWTVISAL 
LLIIPCAGLA WAVQHPEIGF MPLLLIAATA GLGGGNFASS MANISFFYPE REKGWALGLN 
AAGGNIGVAV VQFLVPQVIV LGGGLALARA GLMYLPLAVI AAVCAFLFMD NLVEAKADVG 
SVWSSLRHRD TWIMSLLYIG TFGSFIGYSA AFPTLLNGVF GRPDIALSWA FLGAAVGSVC 
RPFGGRLADA IGGARVTVAS FVLMTGGAYL ALWSVRERWL GVFFLAFMLL FVATGVGNGS 
TYRMISRIFQ VQGEKLGGSP EIMRAMRRQA AGALGIISAV GAFGGFLVPI CYAWAKSAYG 
SIEPALWFYV GFFLVLTVLT WGVYLRPGAR LTGDRV