Gene Mmar10_0958 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mmar10_0958
Symbol
ID	4285446
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Maricaulis maris MCS10
Kingdom	Bacteria
Replicon accession	NC_008347
Strand	+
Start bp	1055001
End bp	1056281
Gene Length	1281 bp
Protein Length	426 aa
Translation table	11
GC content	65%
IMG OID	638140426
Product	Na+ dependent nucleoside transporter
Protein accession	YP_756189
Protein GI	114569509
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG1972] Nucleoside permease
TIGRFAM ID	[TIGR00804] nucleoside transporter

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	39
Fosmid unclonability p-value	0.365704
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACGATC TTTTGCTGCA GGGCCGCAGT TTTGCGGGCC TGTTTCTTCT GGCAGGCATT 
GCCTGGCTGC TCGGGCCGCG CAAAAAACTG CCGATCGTCC TGCTTGTCGG CGCCATCGCG 
CTGCAGCTCG TCATCGCCAC TCTGCTCTAC ACCGTCGCGC CGTTCCGCGC CTTCCTGCAA 
TCGTTGACCG GCGTCGTCGC CGTGCTGCAG GAGGTGACCA ATGAGGGGGC GCAATTCGTC 
TTCGGTTATC TCGCCGGCGG TGCCATCCCC TTCGAGATCG ACCCGGAGGC CGGTGGCGGC 
ACCTTCCTGT TTGCTTTCCA GGCGCTGCCG ATGGTCATCG TATTGTCGGC CCTGTCCGCC 
CTGTTATGGC GCTGGCGGGT GCTGGAAGTG CTGGTCCGCG GCTTTGCCTT TGCCTTCCAG 
CGCCTGCTCA ACCTGTCCGG CTCGGCCAGC CTGGGTGCCG CAGCCAATAT CTTTCTCGGC 
ATGACCGAAA GTCCGGTCCT GATCCGGCCA CGCCTGCCCG ATATGAGCCG CTCCGACCTC 
TTCCTGATCA TGACGGTCGG TTTTTCCACC GTGGCCGGCT CGGTGATGGC GCTCTACGTG 
TCCCAGCTTT CCGGCATCAT TGACGGTGCC GCCGGCCATA TCTTCACCGC CTCGCTGATC 
TCGGTGCCCG CCGCCGTCCT CCTGTCGCGC CTGATGATGC CGGGTGACGC GCCGACGCCG 
GAGGCCGAGG CCAAGGAAAA AGTGCCGACC CAGATCTATC ACTCCTCCAT GGACGCGCTG 
ACCACCGGCG TGTCGGACGG GATGCGGCTT TATTTCAACA TCATCTTCAT GCTGCTGGTC 
TTCACCGCTC TGGTCGCCCT GCTCAACGTC ATGCTGGGCC TGGCCCCCGA CATGTTCGGC 
GCCCCGCTCT CGGTCGACCG CATCCTGGGC TGGCTGTTCG CCCCGATCGT CTGGCTGGCC 
GGCGTGCCCT GGTCGGAAGC GACCCAGGCC GGCTCCCTGA TGGGCCTGAA GACGGCGCTC 
AACGAAGTCT ATGCCTATGA CCGCCTGGCC CAGATCGGCA ACGAGCTGTC GCCGCGCACC 
AGCCTGATCA TGACTTACGC GCTTTGCGGC TTCGCCAACT TTTCCAGCGT CGGCATCCTG 
ACCGGCGGCC TGGTCGCGAT TGCACCTTCG AGGCGCGAGG ACATCCTCCA GCTGGCCCCG 
AAAGCACTGA TCTCCGGCAC GCTGGCGACG CTGATGACAG GCGCCGCGAT TGGCGTGCTG 
CCGCAGGGAT TGTTCGGGTA G

Protein sequence

MDDLLLQGRS FAGLFLLAGI AWLLGPRKKL PIVLLVGAIA LQLVIATLLY TVAPFRAFLQ 
SLTGVVAVLQ EVTNEGAQFV FGYLAGGAIP FEIDPEAGGG TFLFAFQALP MVIVLSALSA 
LLWRWRVLEV LVRGFAFAFQ RLLNLSGSAS LGAAANIFLG MTESPVLIRP RLPDMSRSDL 
FLIMTVGFST VAGSVMALYV SQLSGIIDGA AGHIFTASLI SVPAAVLLSR LMMPGDAPTP 
EAEAKEKVPT QIYHSSMDAL TTGVSDGMRL YFNIIFMLLV FTALVALLNV MLGLAPDMFG 
APLSVDRILG WLFAPIVWLA GVPWSEATQA GSLMGLKTAL NEVYAYDRLA QIGNELSPRT 
SLIMTYALCG FANFSSVGIL TGGLVAIAPS RREDILQLAP KALISGTLAT LMTGAAIGVL 
PQGLFG