Gene Mext_3821 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mext_3821
Symbol
ID	5834733
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium extorquens PA1
Kingdom	Bacteria
Replicon accession	NC_010172
Strand	-
Start bp	4242382
End bp	4243458
Gene Length	1077 bp
Protein Length	358 aa
Translation table	11
GC content	58%
IMG OID	641369612
Product	choloylglycine hydrolase
Protein accession	YP_001641265
Protein GI	163853222
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG3049] Penicillin V acylase and related amidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	48
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATACGGA TTCGCCAGAT CAAAACTATC GTGTCGGTCC TGGCGTTTTG GGCCGTGCTC 
CAAGTCGTTG TTGAACCCGC AGCGGCCTGC TCCCGCTTCG TTTACCTTGG ACGAGACGGC 
AAGATTTTCA CGGCCCGGTC GATGGACTGG GAAAAGCCCA TCGGAACCGA CCTCTACATC 
CTGCCGCGAG GGATGGCGCG CAATGGTGAG GTCGGGCCTG CTTCGATCCG GTGGACGTCG 
AAATATGGAT CCTTGGTCGC GACAGCGTTC GACAATTCGA CCTCGGACGG CGCCAATGAA 
GCGGGCCTTA CGGCCAATGT GCTCTGGCTT GAAGAGTCGC AGTACCCGGC TTTCGACGGC 
AAGGGCCCGC CTAGATTGGC GATCTCAGTC TGGGCGCAAT ACGCTCTCGA CAACTTCGCG 
ACCGTCGATG AAGCCGTTGC CGCCCTCGAG AAGCAACCCT TCACGCTCGT GACAAGCGTG 
ATTCCCGGCA CTCAGGTCAT CGCAAATGTC CATATGTCCC TGTCCGATTC CAGCGGGGAC 
AGTGCCATCA TCGAATATAT CGATGGCAAG CAGGTCATCC ATCATGGGCG CCAATACCAA 
GTGATGACGA ACTCTCCGAC CTACGAACAG CAGCTTGCCC TTGCATCCTA CTGGTCACAG 
ATCGGCGGAA CGGTCATGCT GCCCGGTACG AACCGCGCGT CCGATCGCTT CGCCCGCGCC 
TCCTTCTACG TCAAATCGAT CCCGCAGGAT GGAGACCCGG ATCACCTCTT GGCCAGTGTA 
TACGGCATCA TACGCAATGT TTCCGTGCCG CTTGGGCTTT CGACGCCAGA GAAACCGGAA 
ATATCCTCCA CACGCTGGCG CACGGTCTTC GATCACAAGC GCCGCCTCTA TTTTTTCGAA 
TCGGCGCTTT CACCCAACAC GTTCTGGACC GACCTGAATC AGATCGATTT CTCCAAGGAA 
TCCGGGAAAG TGCTGAAACT CGATCTCGGC GTCGATCAGG CCAACGTCTT CGCCGGAAAC 
GCGACACGGT CCTATCGCGC GTCGGAGCCT TTTCCCTTTG CCGGACTACC GCGATAG

Protein sequence

MIRIRQIKTI VSVLAFWAVL QVVVEPAAAC SRFVYLGRDG KIFTARSMDW EKPIGTDLYI 
LPRGMARNGE VGPASIRWTS KYGSLVATAF DNSTSDGANE AGLTANVLWL EESQYPAFDG 
KGPPRLAISV WAQYALDNFA TVDEAVAALE KQPFTLVTSV IPGTQVIANV HMSLSDSSGD 
SAIIEYIDGK QVIHHGRQYQ VMTNSPTYEQ QLALASYWSQ IGGTVMLPGT NRASDRFARA 
SFYVKSIPQD GDPDHLLASV YGIIRNVSVP LGLSTPEKPE ISSTRWRTVF DHKRRLYFFE 
SALSPNTFWT DLNQIDFSKE SGKVLKLDLG VDQANVFAGN ATRSYRASEP FPFAGLPR