Gene MmarC5_1465 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	MmarC5_1465
Symbol
ID	4927613
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methanococcus maripaludis C5
Kingdom	Archaea
Replicon accession	NC_009135
Strand	+
Start bp	1401778
End bp	1403256
Gene Length	1479 bp
Protein Length	492 aa
Translation table	11
GC content	39%
IMG OID	640166960
Product	sodium/proline symporter
Protein accession	YP_001097976
Protein GI	134046491
COG category	[E] Amino acid transport and metabolism [R] General function prediction only
COG ID	[COG0591] Na+/proline symporter
TIGRFAM ID	[TIGR00813] transporter, SSS family [TIGR02121] sodium/proline symporter

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGTATCTG AAAATTTGAG TATCGTTTTG ATCTTCATGC TCTATTTGCT CGTGGTAATG 
GGCGTGGGTA TGTATTTCTA CAGGCGAAAC GAAACTATAA GCGATTATGT GCTTGGTGGT 
AGAAAATTAA ATAGCTGGGT TGCGGCATTA AGTGCGCAAG CTTCAGACAT GAGCGGTTGG 
CTTTTAATGG GTCTTCCGGG AGTTGCATAT CTTTCTGGAA TGAGTGAAAT ATGGATAGGA 
GTTGGTCTTG CAATAGGAAC TTACCTAAAC TGGAAGTTCG TTGCAGAAAG GCTTAGAAGA 
TACACAGAAA TTGCAAAAGA TTCTATTACA ATACCTGTTT ACTTGGAAAA CAGGTTTAGG 
GATCAGTCTA AAATGTTAAG AATTGTTTCA GCGTTTTTTA TTATGCTATT TTTCTTATTG 
TACACGTCTT CAGGATTAGT TGCGGGCGGA AAATTGTTCA ATCTTGTATT TGGAGTAGAT 
TATACTCTCG CAGTTACAAT AGGTGCTTTA GTAATTATTG GTTATACATT CCTCGGCGGT 
TTCCTTGCAG TTAGCTGGAC TGACTTTATA CAAGGTTCCC TCATGTTTAT TGCAATATTC 
TTAATTCCAA TCATGGGTAT TGTCCACATG GGCGGAATTG ACGCTACAAT GAATGCTTGG 
AATTCAATAA GTCCAGATTA CATAAATCCA TTTACAAATC TCGATGGAGA AGCTCTTGGT 
GCAATGGGGC TTGCATCAGC TCTTGCATGG GGTCTTGGAT ACTTTGGAAT GCCACACATC 
CTTGTAAGGT TTATGGCAAT TCAATCAGCT GATAAAGTTC CAAAAGCAAG AAGAATTGCG 
ACTACCTGGG TTGTAATCAG TCTTTTCATG GCAGTTCTTG TTGGAATGAT TGGTGCAGTA 
GCTCTTGGAG CACCGCTTGA TGATCCAGAG CATGTATTCA TGGCAATGGC ACAAGGATTA 
TTCCCAAGTC TTATTGCAGG GGTATTTTTG GCAGGTGTTT TAGCAGCTAT CATGAGTACT 
GCAGATTCAC AGCTTTTAGT TACTGCTTCG GCAGTTACTG AAGATATTTA TGCATTATTA 
AATAAAAATG CAAGTCAAAA AGAGCTTTTA TGGATAAGCA GGTTTGCAGT AATTGCTGTG 
GCGGCAATAG CTTACTACTT TGCAATAGTT CCTGGAAGCA GCGTTATGGG GCTTGTTTCA 
TACGCATGGG CAGGATTTGG TGGTGCATTT GGTCCAGTGA TATTGCTTTC ATTATACTGG 
AAGAGAATGA CTAGAAATGG TGCTCTTGCA GGTTTACTTT CCGGCGGATT TATGGTAATT 
CTCTGGAAAA ACTTGAGCGG TGGAATATTT GATTTATACG AAATCGTTCC AGCATTTTTG 
CTCGCAACAA TAATGATTAT AGTTGTAAGT TTAATTGATA AAGAACCTTC ATTAGAAATT 
CAGGAAGAGT TCGACAGAGC AGTTTCCGAA ATGAAATAG

Protein sequence

MVSENLSIVL IFMLYLLVVM GVGMYFYRRN ETISDYVLGG RKLNSWVAAL SAQASDMSGW 
LLMGLPGVAY LSGMSEIWIG VGLAIGTYLN WKFVAERLRR YTEIAKDSIT IPVYLENRFR 
DQSKMLRIVS AFFIMLFFLL YTSSGLVAGG KLFNLVFGVD YTLAVTIGAL VIIGYTFLGG 
FLAVSWTDFI QGSLMFIAIF LIPIMGIVHM GGIDATMNAW NSISPDYINP FTNLDGEALG 
AMGLASALAW GLGYFGMPHI LVRFMAIQSA DKVPKARRIA TTWVVISLFM AVLVGMIGAV 
ALGAPLDDPE HVFMAMAQGL FPSLIAGVFL AGVLAAIMST ADSQLLVTAS AVTEDIYALL 
NKNASQKELL WISRFAVIAV AAIAYYFAIV PGSSVMGLVS YAWAGFGGAF GPVILLSLYW 
KRMTRNGALA GLLSGGFMVI LWKNLSGGIF DLYEIVPAFL LATIMIIVVS LIDKEPSLEI 
QEEFDRAVSE MK