Gene Mext_3839 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mext_3839
Symbol
ID	5833469
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium extorquens PA1
Kingdom	Bacteria
Replicon accession	NC_010172
Strand	+
Start bp	4265817
End bp	4267520
Gene Length	1704 bp
Protein Length	567 aa
Translation table	11
GC content	70%
IMG OID	641369629
Product	hypothetical protein
Protein accession	YP_001641282
Protein GI	163853239
COG category	[R] General function prediction only [S] Function unknown
COG ID	[COG0446] Uncharacterized NAD(FAD)-dependent dehydrogenases [COG3453] Uncharacterized protein conserved in bacteria
TIGRFAM ID	[TIGR01244] conserved hypothetical protein TIGR01244

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.359472
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	39
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAATTTT ATATAGCGAC GGAGCCGTCG GTGGACGTCC ATCACATCAC GCGCGACTTG 
GCCGTCGCGC CACAGATCCG GCCTGACGAC ATCCCGGCGG TCGCGTCCGC CGGGTTCCGG 
TCGATCCTCT GCAACCGCCC CGACGGCGAG GCCCCCAACC AGCCGAATTT TCGTGAGATC 
GAGCGGCGGG CCGGGGAGGG CGGCCTCGTC GTCCGCTACC TGCCGGTCAC GTCGAGCCGT 
ATCACCGACG CGGATGTCGC AGCCTTCGAG GCGGCGGCGG ACGCCCTACC GAAGCCGATC 
CTTGCCTATT GCCGCACCGG CACGCGCTCG GCGACGCTGT GGTCGCTCGC CCAGGCACGG 
CGCGGCCGCG CCGTGGCGGA GATCCTGGCT GCGACGAAGG CCGCAGGCTA CGACCTGAAA 
GGCGCCGCGC CCCGGATGGC GGCGCAGGCC GGCGCGGCGA AAGAGAGAAC CGAGCAACGG 
TTCGCGATTG TCATCGTCGG CGGCGGCTCG GCCGGCCTCG CGGCGGCCTC AAGCCTGAAG 
GCGCGCAAGC CCGACCTGGA GGTCGCCGTG ATCGATCCGG CCGACATCCA CTACTACCAG 
CCCGGCTGGA CACTGGTGGG CGCCGGCGTG TTCGACCCGG CGGTGACCGC CCGGACCATG 
GCGTCCCTGA TCCCGGACGG CGTGACGTGG ATCAAGGCCG GCGTTGTCGC CTTCGAGCCG 
CAGAGGAAGG CCGTGATGCT GGAGGACGGC CGGACCATCG GCTACGACCG CCTCGTCGTC 
GCCCCCGGCC TCAAGCTCGA CTGGGACGGC ATCGAGGGGC TGGTCGAAAC GCTCGGCCGG 
AACGGGGTCA CCTCGAACTA CCGCTTCGAC CTCGCGCCCT ATACCTGGGA GCTGGTCCGG 
AACCTCGGCG GAGGACGGGC CGTGTTCACC CAGCCCCCCA TGCCGATCAA GTGCGCGGGC 
GCCCCGCAGA AGGCGATGTA TCTCTCCGCC GACCATTGGC GGCGCGCGGG CCGCCTGAAG 
CAGATCGGGA TCGACCTCTT CACGGCGGCC CCGAGCCTGT TCGGCGTGAA GGAATACGTG 
CCGCCCCTGA TGGAGTACGT CCGGCGCTAC GACGCGAAGC TGCACTTCCG TCACGACCTC 
ACGCGCATCG ACGGCTCGGC CAAGCGCGCG TGGTTCACCC GCACGGCCGA GGACGGAACC 
CAATCGACGG TCGAGACCGG GTTCGACATG ATCCATGTCG TTCCGCCCCA GCAGGCCCCC 
GATTTCATCA GGGAATCCCC CCTGGCGGAT CCGAGCGGCT GGGTCGAGGT GGACCCGGCG 
AGTCTGCGCC ACAAGCGCTT TACCGACGTG TACGGGCTGG GCGACGCTTG CAGCGCGCCG 
AACGCCAAGA CCGCCGCCGC GGCGCGCAAG CAGGCGCCGG TGGTGGCGCA CAACCTGCTG 
CGCGACATGG GCTTCATCGA GGGGCCGGAT GCCATTTACG ATGGCTACGG CTCGTGCCCG 
CTCACCGTCG AGCGCGGCAA GATCCTGCTT GCCGAGTTCG GCTATGGCGG CAAGCTTCTT 
CCCAGCTTCC CGTCCTGGCT GCTCGACGGC ACGAAGCCGA GCCGGGCCGC GTGGCTGCTC 
AAGGAGCGCC TGCTCCCGCC CCTCTACTGG CACGGCATGC TCAAGGGGCG CGAGTGGATG 
GCCAAGCCCA GGCGGGCGGT TTGA

Protein sequence

MQFYIATEPS VDVHHITRDL AVAPQIRPDD IPAVASAGFR SILCNRPDGE APNQPNFREI 
ERRAGEGGLV VRYLPVTSSR ITDADVAAFE AAADALPKPI LAYCRTGTRS ATLWSLAQAR 
RGRAVAEILA ATKAAGYDLK GAAPRMAAQA GAAKERTEQR FAIVIVGGGS AGLAAASSLK 
ARKPDLEVAV IDPADIHYYQ PGWTLVGAGV FDPAVTARTM ASLIPDGVTW IKAGVVAFEP 
QRKAVMLEDG RTIGYDRLVV APGLKLDWDG IEGLVETLGR NGVTSNYRFD LAPYTWELVR 
NLGGGRAVFT QPPMPIKCAG APQKAMYLSA DHWRRAGRLK QIGIDLFTAA PSLFGVKEYV 
PPLMEYVRRY DAKLHFRHDL TRIDGSAKRA WFTRTAEDGT QSTVETGFDM IHVVPPQQAP 
DFIRESPLAD PSGWVEVDPA SLRHKRFTDV YGLGDACSAP NAKTAAAARK QAPVVAHNLL 
RDMGFIEGPD AIYDGYGSCP LTVERGKILL AEFGYGGKLL PSFPSWLLDG TKPSRAAWLL 
KERLLPPLYW HGMLKGREWM AKPRRAV