Gene Mmar10_2043 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mmar10_2043
Symbol
ID	4286806
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Maricaulis maris MCS10
Kingdom	Bacteria
Replicon accession	NC_008347
Strand	+
Start bp	2222785
End bp	2224002
Gene Length	1218 bp
Protein Length	405 aa
Translation table	11
GC content	69%
IMG OID	638141544
Product	major facilitator transporter
Protein accession	YP_757273
Protein GI	114570593
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	45
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGTGGCA GCGCCAGCCT TCCCGGCAAG GCGACCGCAC TTGCCCTGAT CGCCACATCG 
CAAGTCCTCG CCCTGTCCAT CTGGTTCGCC GGAGCCGCCG CCCTGCCCGC CTTGATGGCC 
GCTACCGATA TCGGGCCCAT GCGACAGGCC GCCCTGACCA GTTCGGTCCA GCTCGGCTTT 
GTCATCGGCG CCGTGCTCAG CGCCGTGACC GGGCTTGCCG ACCGCTTGCC GCCGCAGCGC 
CTGTTCGCAC TCGGCAGTAT CATTGCCGCC CTGGCCAATA TCGCCGCCCT GCAGCTGGAA 
CCAGGCGGCT GGAGCCTGAT CGCCAGTCGG GCTCTGGCCG GTGCCGCTCT GGCCCTGGTC 
TATCCGGTCG GCATGAAGCT GGCGGCCAGC TGGGCACGAG GCGATGCGGG CTTTCTGGTC 
GGGTTGCTGG TCGGTGCGCT GACCCTGGGC TCGGCCCTGC CCTTCATGTT CAACCTGGCT 
GGCGACATCG CCGACTGGCG CCTGCCCTTC ATGGCGTCAG CGATGGCCGC CCTGATCGCG 
GCCAGCCTGA TCCTGCTGGC CCGCGGCGGG CCGGGCCTGC GCCCGGCCGC CCGGCTGGAC 
CCCGGCGCAT TCACACTGTC TGTCCGCGAC CCGGCCTTGC GTCTCGTCAA TCTGGGCTAT 
CTCGGTCACA TGTGGGAGCT GTACGCCATG TGGGCCTGGA TCGGCCCGTT TGCTCACGCC 
TATTGGACGC GGCTGGGCGG TGATGCCCGA CTGGGTGACC TGACCGCCTT TGCGGTCGTC 
GCCAGCGGCG CCATCGCCTG TCTCGCCGCC GGCCGCCTGG CTGACCGGTT CGGCCGCACA 
CGCATCACCA TCATCGCCCT GGGCATTTCC GGCAGTTGCG CCCTGCTGGT CGGCCCCGCC 
TTCGCGCTGG CGCCCTGGCT GATGATCCCG CTTTTGATTG TCTGGGGCAT GGCGGTGATC 
GCCGACAGCG CCCAGTTCTC CGCCGCCATC ACCGAGCTGG CGCCGCCGGA ACGGACCGGC 
ACCTTGCTGA CCATCCAGAC GGCGATGGGC TTTACCCTGA CCGTGATCAT GATCCAGGCC 
TTGGGCTATT GGATCGAACT TGTCGGTTGG GCATGGGCCT TCACGCCGTT GGCGATCGGA 
CCGGCTGTCG GAGTTTGGGC GATGGCCCGC CTGCGCGCCC GACCGGAAGC GGCCAGGCTC 
GCAGGCGGCA ATCGCTGA

Protein sequence

MSGSASLPGK ATALALIATS QVLALSIWFA GAAALPALMA ATDIGPMRQA ALTSSVQLGF 
VIGAVLSAVT GLADRLPPQR LFALGSIIAA LANIAALQLE PGGWSLIASR ALAGAALALV 
YPVGMKLAAS WARGDAGFLV GLLVGALTLG SALPFMFNLA GDIADWRLPF MASAMAALIA 
ASLILLARGG PGLRPAARLD PGAFTLSVRD PALRLVNLGY LGHMWELYAM WAWIGPFAHA 
YWTRLGGDAR LGDLTAFAVV ASGAIACLAA GRLADRFGRT RITIIALGIS GSCALLVGPA 
FALAPWLMIP LLIVWGMAVI ADSAQFSAAI TELAPPERTG TLLTIQTAMG FTLTVIMIQA 
LGYWIELVGW AWAFTPLAIG PAVGVWAMAR LRARPEAARL AGGNR