Gene Sare_0191 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_0191
Symbol
ID	5706327
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	-
Start bp	205219
End bp	206637
Gene Length	1419 bp
Protein Length	472 aa
Translation table	11
GC content	67%
IMG OID	641269717
Product	major facilitator transporter
Protein accession	YP_001535117
Protein GI	159035864
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG2223] Nitrate/nitrite transporter
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	4
Fosmid unclonability p-value	0.000226974
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

GTGCCCGTCA AACCCACTCC CGACGACCCG ACCCCGGACG AAACGGCTGC CGGCCAGAAC 
AGCCGCGACG ATCGTGGGCG CAACCGGGTC CTCACCCTGT CCACCATCGG CTTCACCGTC 
ATGTTCGCGG TGTGGCTCAT GTTCGGCATC CTCGGCAAGC CGATCAGCGA CGAGTTCAAC 
CTCTCCGAGG TGCAACTGTC CTGGATCATC GCCGCCGCCG TGCTCAACGG CTCGCTCTGG 
CGGCTCCCCG CCGGCATCGT GGCGGACCGC ATCGGCGGAC GCCGAGTGAT GACGGCGATG 
CTTCTCCTGA CCGCGCTGGC CTCGTTCCTC GTGTCCCGCG CCAATTCCTA CCCGATGCTG 
CTGGCGCTGG CGTTTCTGGT CGGCTTCGCC GGCAACTCGT TCACCGCTGG TATCGCCTGG 
AACTCGGCGT GGCAGCCGCG GGAGAAGCAG GGTTTCGCGC TCGGCCTGTT CGGTGCGGGC 
AACGTCGGCG CATCGGTAAC CAAGTTCATC GGCCCGCCGC TGATCGCGGG AACCGCGGGC 
GCCACCTACC TCGGCGTTAT CGAGGGTGGT TGGCGCCTCG TCCCCGTCGT CTACGCGGTG 
TTGCTGCTCG TCCTCGCGGC GGCTACGTGG TTCCTCACCC CCCGCCGCGA CCGCGTGCCA 
AGCCACGGCA CCCCGCTGCG CGAACAGCTC GAACCGCTCA AGCAGATACG AGTGTGGCGA 
TTCAGCCTGT ACTACGTGGC GGTGTTCGGG GCCTATGTGG CGCTCGCCGC GTGGCTGCCG 
ACCTACTACA TGAACAACTA CGACGTGTCG CTGCAGACCG CGGCCTATCT GACCGCCCTG 
TACATCTTCC CCGCCTCGCT GCTGCGACCG GTCGGCGGGT CGTTGTCCGA CCGTCTGGGT 
GCCCGCCGCG TCATGTACTG GACATTCGGC CTCATGCTGC TCAGCACGGG CATCCTGATG 
ATGCCCCCGG GCCACATCGT CGTCGACCAC CCCGATGGCA CGCAGACCAG TCACCTCGCC 
TACCAGCTCG GCATCGTGCC CTTCACTGTT CTGGTCGTCC TGCTCGGCTG CGCCATGGGC 
GTCGGCAAGG CCGCGGTGTA CAAGCACATC CCCGAGTACT TCCCGCGCCA GGTCGGGGCC 
GTGGGCGGTC TGGTCGGCAT GCTCGGCGGC CTCGGCGGGT TCTTCCTGCC CCCGATGTTC 
GCCTACACCA AGGCGTGGAC GGGCCTCCCC TCCAGCACCT TCCTGGTCCT GTTCATACTC 
ACCGCTATTT GCGCTGTTTG GATGCACCTG ACCGTGGTTC GCATGTTGCA CGGTGAATCG 
CCCCAGCTTG CCGACCATTT CGAGAAGCCA GAACCCGTTG ACCAGCCGAC CGCTCCGGCT 
ACGGCGGCGA CCCGTGTGCC TGAGGAGGCC CGCGAATGA

Protein sequence

MPVKPTPDDP TPDETAAGQN SRDDRGRNRV LTLSTIGFTV MFAVWLMFGI LGKPISDEFN 
LSEVQLSWII AAAVLNGSLW RLPAGIVADR IGGRRVMTAM LLLTALASFL VSRANSYPML 
LALAFLVGFA GNSFTAGIAW NSAWQPREKQ GFALGLFGAG NVGASVTKFI GPPLIAGTAG 
ATYLGVIEGG WRLVPVVYAV LLLVLAAATW FLTPRRDRVP SHGTPLREQL EPLKQIRVWR 
FSLYYVAVFG AYVALAAWLP TYYMNNYDVS LQTAAYLTAL YIFPASLLRP VGGSLSDRLG 
ARRVMYWTFG LMLLSTGILM MPPGHIVVDH PDGTQTSHLA YQLGIVPFTV LVVLLGCAMG 
VGKAAVYKHI PEYFPRQVGA VGGLVGMLGG LGGFFLPPMF AYTKAWTGLP SSTFLVLFIL 
TAICAVWMHL TVVRMLHGES PQLADHFEKP EPVDQPTAPA TAATRVPEEA RE