Gene Dret_1961 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dret_1961
Symbol
ID	8419806
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfohalobium retbaense DSM 5692
Kingdom	Bacteria
Replicon accession	NC_013223
Strand	+
Start bp	2244434
End bp	2245882
Gene Length	1449 bp
Protein Length	482 aa
Translation table	11
GC content	59%
IMG OID	645038549
Product	sodium/proline symporter
Protein accession	YP_003198823
Protein GI	258406081
COG category	[E] Amino acid transport and metabolism [R] General function prediction only
COG ID	[COG0591] Na+/proline symporter
TIGRFAM ID	[TIGR00813] transporter, SSS family [TIGR02121] sodium/proline symporter

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.0044995
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGATGAGTG TGCCCACCTT TACCTCCTTT GTCGTCTACT TGATTGTCAT GATGTCCATC 
GGGATTTTTT TCTACTACCG GACCAAAAAC CTCTCGGACT ACATCCTCGG CGGACGCCAA 
CTCAGCCCGG CAGTGGCCGC CTTGAGCGCC GGGGCTTCGG ACATGAGCGG CTGGTTGTTG 
CTCGGTCTGC CCGGGGCCAT GTACGCCGGA GGGATGAACA ACATCTGGAT CGCTGTCGGC 
TTGTCCATTG GCGCCTATCT GAACTGGCAG TTCGTGGCCA AGAAATTACG GACCTATACG 
GAAAAGGCCG GTGACGCGAT CACCCTGCCC GACTACCTGG AAAACCGCTT CGGCGATTCC 
TCGCGCATCC TGCGGGTCAT CTCGGCCATC GTGATTCTCA TCTTCTTCAC TATCTACGTC 
TCTTCCGGCC TGGTCGGCGG GGCCATCCTT TTCGAGAAAA CCTTTGGCCT GAACTACCAG 
CTCGCCCTGT GGGTCGGGGC CCTGGTCATC GTGGCCTACA CCTTTCTCGG CGGGTTCATG 
GCCGTCAGCT TGACCGACTT TCTCCAGGGA ACGCTGATGT TTATCGCGTT GCTGGTGGTT 
CCGGCCGTCG TGATCGCCAA AATGGGCGAT TGGGGCACCG TGGTCGACAA GGTCGCGCAT 
GTCGACGCCA AATATGTGGA CGCCTTTTCC GGCATGACCT TGCTGTCGAT TATCTCTCTC 
ATGGCCTGGG GACTGGGCTA TTTCGGGCAG CCCCATATTC TGGCCCGCTT CATGGCCATC 
CGGCGGGCCA AGGACGTGCC CAAGGCGCAG ATGGTCGGCA TGACCTGGAT GGTTCTGGGC 
CTTTTCGGGG CCATTTTCAC CGGTTTTGCC GGCATCGCCT ATTATGTGGG CAGTCCGCTG 
GAAAATTCAG AAACCGTCTT CATCGCTTTG ACCCAGGCCC TCTTCAATCC CTGGATCGCC 
GGCATCCTGC TGGCCGCCAT TCTTTCGGCC ATCATGTCCA CCGTCGACTC CCAGCTTTTG 
GTCTGCTCCA GCGCTATTGC CGAAGACTTT TACAAACAGA TCCTGCGCAA GGAAGCCCCG 
CAAAATGAAC TGGTCTGGAT CGGACGGGTG TCCGTGCTCA TCCTGGCCCT GATCGCGACC 
TCCCTGGCGG CCGACCCGAA CAGCAAGGTC CTGGACCTGG TGGCCTACGC CTGGGGCGGC 
TTTGGCGCCG CCTTCGGCCC GGTGGTCATT TTGTCCCTGT TCTGGCGGCG CATGACCCGC 
AACGGGACCC TGGCCGGGAT GATCGTCGGC GCTGTGACCG TCATCGTCTG GAAGCACATG 
ACCGGTGGCC TTTTTGATCT CTACGAGATC CTGCCCGGGT TTCTGTTCTG TGCTCTGACC 
GTTATCATCG TCAGCCTCCT GGACAAAGCC CCCGGCAAAT CCGTCACTGA GGTTTTCGAC 
TCCGTCTGA

Protein sequence

MMSVPTFTSF VVYLIVMMSI GIFFYYRTKN LSDYILGGRQ LSPAVAALSA GASDMSGWLL 
LGLPGAMYAG GMNNIWIAVG LSIGAYLNWQ FVAKKLRTYT EKAGDAITLP DYLENRFGDS 
SRILRVISAI VILIFFTIYV SSGLVGGAIL FEKTFGLNYQ LALWVGALVI VAYTFLGGFM 
AVSLTDFLQG TLMFIALLVV PAVVIAKMGD WGTVVDKVAH VDAKYVDAFS GMTLLSIISL 
MAWGLGYFGQ PHILARFMAI RRAKDVPKAQ MVGMTWMVLG LFGAIFTGFA GIAYYVGSPL 
ENSETVFIAL TQALFNPWIA GILLAAILSA IMSTVDSQLL VCSSAIAEDF YKQILRKEAP 
QNELVWIGRV SVLILALIAT SLAADPNSKV LDLVAYAWGG FGAAFGPVVI LSLFWRRMTR 
NGTLAGMIVG AVTVIVWKHM TGGLFDLYEI LPGFLFCALT VIIVSLLDKA PGKSVTEVFD 
SV