Gene Mbar_A3566 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mbar_A3566
Symbol
ID	3626495
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methanosarcina barkeri str. Fusaro
Kingdom	Archaea
Replicon accession	NC_007355
Strand	+
Start bp	4578374
End bp	4580062
Gene Length	1689 bp
Protein Length	562 aa
Translation table	11
GC content	43%
IMG OID	637702398
Product	dipeptide/oligopeptide-binding protein
Protein accession	YP_307015
Protein GI	73671000
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0747] ABC-type dipeptide transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.672958
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.0864129
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAGAAAA AAAAGTTATT ATTTTCTATT TTCTTGACAG CCCTGATTTT AATAACGGCG 
GGCTGCGCTA ATAAGGACAG CCCTCAGGCC GGGACATCGG CTGAAAACGC TTCTGATCAG 
ACCGGAACAT TGGTTGAGAA CCCTTCCGAC GGATCAAAGT ATGTGAATGT TGTTAATCTA 
AGCGGCGGGG ATTATGGCTA TCCACAGCCA TTTTCGATAT ATCCGAGAGG TCCTGGGTCA 
TCAAAAGTTG GAATGATCTT TGACAGTCTG TTCGAAAGGG ATGAAAAAGG TATAATTCCC 
TGGCTGGCTG AAAGCTGGGA TGCCAATTCA AATGGAACAG AATATACAGT TTATCTCCGT 
GACGGTGTCA ACTGGAGCGA TGGAGTGCCT TTTACGGCAA ATGATGTTAA ATTTACTTTT 
GATTATGAGC AGAAAAATGT ACCCATATCA GGTGGAATTG AGTCCGGTAT TATAGATAAT 
GTTCAGGTCG TGAATTCCAG TACCGTCAAG TTCGTACTCA CGCAGCCTGC TTCTCCATTT 
ATTTATAAGG TCACGAGTTT CAAAATCATA CCTGAGCATA TCTATAAAAA TGTCTCCGAT 
CCTACCAGTT TCCTTGACCC AGAAGCAGTC ATCGGTACTG GCCCGTTCAT TCTTGATGAG 
TACAACAAAG AGCATGGAAC ATATCGGTTT GTAGTAAATG AGAATTTCTG GGGACCGGAA 
CCTGCCGTTA AAGCCGTTGA ATTTATTCCG GTCAGCGACT CATTAATAGC TTTTGAACAA 
GGACAAATAG ATTTCACAAG TATATCGCCT GATACTCTTG ACCGGTTCAA ATCAGATTCT 
GATATAAGAA TAGTCCAGCA GCCGGCTTTC TGGGGTTACC AGTTTTATTT CAATATGAAA 
AACTGTCCTG AGCTGAATGA CAGTAGAATA AGGCAGGCCT TTGCTTACGC CATTGATCGC 
GATGAACTGG TGGAAAAGAT CGCAAGAGGT GCAGGGAAAG CCGGTAAAAT GGGCATACTC 
CCTGAAGACC ATATCTGGTA TAACTCTGAC CAGCCGAAAT ATGACTACAA TCCGGATAAA 
GCCCGAGCAT TGCTTGAAGA AGCCGGATGG ACTGACACAG ATGGGGATGG GATACGTGAT 
AAAAACGGGG AAAAACTGTC ATATGTATTA TCTCTTGGAT CATCTGCTGC TGGCAATAGC 
GAAGTCCGTA TCGGCGAACT TATAAAAGAG AGACTAAATG AAGTAGGAAT TGACGTTCAG 
GTAAAAGCCC TTGAGAGCAA ATCCCGTGAT GCCAATCTAA AGAGCGGAGA CTTTGAACTT 
GCGATCAGCG GCTTTGGCGG CTGGGGACAG GATGCAGATT ATCTCCGTAC AAGATACTGT 
GACACAGGTG CACAGTCAGG AAGTGTATCA TCTGGAGCAG CAGTATTTGG TTACCACAAC 
GATACCCTGA ATGATCTTGG TGCTCAGGAA TTACAGGAAT TGAACGATGA TAAACGGAAA 
GAAATAGTAT ACAATATGCA GACCGTGCTT GCTAATGATG TACCCGCAAT ACCGCTCTAT 
TATACTACAT CATATGATGT ATGGCGCATT TCAAAATATG ACGGCTGGAT GAATAGGTAC 
GATCACCATG CAAGAACACA CAATATTCTT TCGTATTTAG AGAGGGATGG AATTGCAGCA 
AAAAGATAA

Protein sequence

MEKKKLLFSI FLTALILITA GCANKDSPQA GTSAENASDQ TGTLVENPSD GSKYVNVVNL 
SGGDYGYPQP FSIYPRGPGS SKVGMIFDSL FERDEKGIIP WLAESWDANS NGTEYTVYLR 
DGVNWSDGVP FTANDVKFTF DYEQKNVPIS GGIESGIIDN VQVVNSSTVK FVLTQPASPF 
IYKVTSFKII PEHIYKNVSD PTSFLDPEAV IGTGPFILDE YNKEHGTYRF VVNENFWGPE 
PAVKAVEFIP VSDSLIAFEQ GQIDFTSISP DTLDRFKSDS DIRIVQQPAF WGYQFYFNMK 
NCPELNDSRI RQAFAYAIDR DELVEKIARG AGKAGKMGIL PEDHIWYNSD QPKYDYNPDK 
ARALLEEAGW TDTDGDGIRD KNGEKLSYVL SLGSSAAGNS EVRIGELIKE RLNEVGIDVQ 
VKALESKSRD ANLKSGDFEL AISGFGGWGQ DADYLRTRYC DTGAQSGSVS SGAAVFGYHN 
DTLNDLGAQE LQELNDDKRK EIVYNMQTVL ANDVPAIPLY YTTSYDVWRI SKYDGWMNRY 
DHHARTHNIL SYLERDGIAA KR