Gene Mpal_1352 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mpal_1352
Symbol
ID	7269957
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methanosphaerula palustris E1-9c
Kingdom	Archaea
Replicon accession	NC_011832
Strand	+
Start bp	1397076
End bp	1398185
Gene Length	1110 bp
Protein Length	369 aa
Translation table	11
GC content	61%
IMG OID	643569986
Product	glycine betaine/L-proline ABC transporter, ATPase subunit
Protein accession	YP_002466408
Protein GI	219851976
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1125] ABC-type proline/glycine betaine transport systems, ATPase components
TIGRFAM ID	[TIGR01186] glycine betaine/L-proline transport ATP binding subunit

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.739461
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.456479
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAGAACA ACCGACCATT CGAACGGATT GACACGATTT TCCTCGACCG GGTGACCAAG 
CGGTACGGCT CGGTAGCAGC GGTGGAGAAC CTCTCGCTTG AGATCGACGG GGGTGAACTG 
ATCTGCCTGA TCGGGGGATC AGGCTCAGGG AAGACGACCA CACTCAGAAT GTGTAATCGG 
CTCATCGAGC CCGACTCCGG ACGTGTGCTG ATCAACGGGG CCGATCTAAA GACGATCGAC 
CCGGTCAGAC TGCGCAGGCA CACCGGGTAC GTGATCCAGT CGATCGGTCT CTTTCCTCAT 
ATGACGGTCG GGGAGAACAT CGGGCTGATC CCACACCGTG AGGGATGGGA TGAAGAGCGT 
GTAAAAAAAA GGGTCAGTGA ACTGCTCCGG CTGGTCGCCC TCCCCCCGGA GACCTTCCTC 
TCCCGGTATC CCCGTGAGCT CTCAGGGGGG CAGCAGCAGC GGGTCGGTCT CGCCCGGGCC 
CTCGCGATGG ACCCCCCGCT GCTGCTGATG GACGAGCCGT TCGGGGCACT CGACCCGCTG 
CTCCGTCACC AGTTACAGGA TGAGTTTCTT AAGATCAAGC AGGTGATCGG GCGGACGATC 
CTCTTTGTGA CCCATGACCT TGAAGAAGCA TTCCGGCTCG GGGACCGGGT GGCCGTTCTC 
GATCAGGGAC GACTGGTGCA GGTTGGTACC CCCGATGAAC TCCTCTTCTC ACCTGTCAAC 
GCAGCAGTGG CGAATCTGTT CGGTTCCGGG GCAAAGTACA GGCATCTCGA CCGGTTGACA 
GTCCGTGACC TGATGAGCCG GGTCCTGGTC CTGGACGGGG GGGTCTCCGC AGGTAATGCC 
GCCATCCTGC TCGATCAAAG ACAGAGCTCC ATCGCAGCCA TTGTCTCTGA TGGGGTGGCC 
CAGGGGGTGA TCGAGAGAGA CGGGCTGACA GCAGGGGAGC AGGCGATCAG CACCCTTGCC 
ACCGATGTTC CGATGGTTGC CGCCAGCGAT GGGGCGGAGG CGACGATCCG GATGCTCAGG 
GATCTGGCAG CCCCCTTCGC CCTGGTGATG GAGCACGATC ATCCGGTTGG GATTCTGAAC 
CCGGCAGAGG CGCTGCTTTC ACTGGTGTAG

Protein sequence

MQNNRPFERI DTIFLDRVTK RYGSVAAVEN LSLEIDGGEL ICLIGGSGSG KTTTLRMCNR 
LIEPDSGRVL INGADLKTID PVRLRRHTGY VIQSIGLFPH MTVGENIGLI PHREGWDEER 
VKKRVSELLR LVALPPETFL SRYPRELSGG QQQRVGLARA LAMDPPLLLM DEPFGALDPL 
LRHQLQDEFL KIKQVIGRTI LFVTHDLEEA FRLGDRVAVL DQGRLVQVGT PDELLFSPVN 
AAVANLFGSG AKYRHLDRLT VRDLMSRVLV LDGGVSAGNA AILLDQRQSS IAAIVSDGVA 
QGVIERDGLT AGEQAISTLA TDVPMVAASD GAEATIRMLR DLAAPFALVM EHDHPVGILN 
PAEALLSLV