Gene Mbar_A0405 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mbar_A0405
Symbol
ID	3627041
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methanosarcina barkeri str. Fusaro
Kingdom	Archaea
Replicon accession	NC_007355
Strand	-
Start bp	483434
End bp	484645
Gene Length	1212 bp
Protein Length	403 aa
Translation table	11
GC content	52%
IMG OID	637699299
Product	transporter
Protein accession	YP_303968
Protein GI	73667953
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.474552
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCGGAAG AAATAAATTA TTATTCGAAA AAGGACACAT TCCAGACTGG AAATGTCTCT 
GAGCCAGGTA AAGGGCTTGT CTTTGCAATG GCCTGTGCAT GTGGAATTGC AGTGGCGAAC 
ATCTATTATA ACCAGCCAAT GCTTGGGGTT ATCACTCGCT CCTTTCCTGG CGAATTGGCT 
CCCAGCCTCA TTCCTACTGC TACTCAACTC GGTTACGCAA TCGGTTTGCT GCTTCTGGTG 
CCTCTGGGAG ATCTGATAGA ACGTCGTCGA CTCATCGTAT CCCAGTTCCT TGTTTTGGCC 
TTATCACTGC TTTTTGCCGC CGCCGCATCT ACTGGTTGGG CCTTGCTGAG TGCTTCACTT 
TGCATTGGCT TTACCGCTTC TGTCACGCAG CAGATAATAC CGGCTGCCGC ATCACTAGCC 
TCTGATAACC GCCGAGGTGC AATTATAGGT AGCGTTATGA GCGGGCTGTT GAGCGGCATG 
CTTTTGAGCC GGATTCTTGC CGGTTTTATC GCTACTAACT ACGGCTGGAG AGCGATGTTC 
TGGCTTGGCA TTCCCCTAGT TCTGGCTGGT GCGGCAGCAA TGGCGCTGTT ATTGCCGCTC 
AGCCATCCCG TGACTTCTAT GAACTATGGC TCGCTGCTTC GTTCACTCCT ACAACTTTGG 
CGCGAGGAAT CCAGGCTACG TCGCGCCACA TTTATACAGG GTTTGCTTTT TGCCGTGTTC 
AGTGCCTTCT GGACGATCCT CGCACTTCAT CTTGAACAGC CCCCTTTCCA CCTCGGCGCC 
GACGTCGCAG GACTTTTTGG AATTCTTGGG ATGGTTGGAG TGCTTGCTGC TCCCATAGCT 
GGACGTCTAG CCGACCGCCG GGGACCAGGC CAGGTTGTTT CTACAGGTGC GTTTGCCGCT 
CTGCTAGCCT GGCTGATTCT TGCAGGCTGG AATTCTCTTG CTGGCCTGGT TTTCGGTGTC 
ATGCTTCTTG ATTTCGGGAT GCAGAGTGCC ATGGTTGCCA ATCAACAGGT AATTTACGGG 
CTTAAGCCAC AAGCACGCAA CCGGGTGAAT AGTTTGTTCA TGGTAGGGAT GTTTATTGGC 
GGCAGCCTGG GGTCTGGAGG TGCAATGCTG GCCTGGAAGA TAGCAGATTG GAAGGGCGTT 
GCCGTTTCTG CTATTGCTGT AGCACTTACA GCTTTCCTGG TACCACTTTT GCTCCAACGC 
AATCATTCAT GA

Protein sequence

MSEEINYYSK KDTFQTGNVS EPGKGLVFAM ACACGIAVAN IYYNQPMLGV ITRSFPGELA 
PSLIPTATQL GYAIGLLLLV PLGDLIERRR LIVSQFLVLA LSLLFAAAAS TGWALLSASL 
CIGFTASVTQ QIIPAAASLA SDNRRGAIIG SVMSGLLSGM LLSRILAGFI ATNYGWRAMF 
WLGIPLVLAG AAAMALLLPL SHPVTSMNYG SLLRSLLQLW REESRLRRAT FIQGLLFAVF 
SAFWTILALH LEQPPFHLGA DVAGLFGILG MVGVLAAPIA GRLADRRGPG QVVSTGAFAA 
LLAWLILAGW NSLAGLVFGV MLLDFGMQSA MVANQQVIYG LKPQARNRVN SLFMVGMFIG 
GSLGSGGAML AWKIADWKGV AVSAIAVALT AFLVPLLLQR NHS