Gene Mext_3507 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mext_3507
Symbol
ID	5833702
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium extorquens PA1
Kingdom	Bacteria
Replicon accession	NC_010172
Strand	-
Start bp	3884461
End bp	3885999
Gene Length	1539 bp
Protein Length	512 aa
Translation table	11
GC content	69%
IMG OID	641369306
Product	PAS sensor protein
Protein accession	YP_001640963
Protein GI	163852920
COG category	[T] Signal transduction mechanisms
COG ID	[COG4191] Signal transduction histidine kinase regulating C4-dicarboxylate transport system
TIGRFAM ID	[TIGR00229] PAS domain S-box

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	41
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGCTTT CCATGGCCGC GGCTGAGGCG ATTCAGGGGG GCGGCGAAGC GCTGACGGCC 
GAGGACTTCC GGCAGACCCT CCACGAGGTC GGTGTCTGCA TCTGGTCGCT GGACATTTCC 
ACCGGCCGTG TCAGCGCTTC GCAGACCTGC GGCTGCCTCT TCGGTATTCC AACCGAACGT 
CTGACGAGCT TTGCCGCGAC CCAGGATCTG GTCCACCCGG ACGACCGCCA AGCTCGCGCT 
CACGCCATCG AGAGCGTGCT GCGGGACGGC GGCAGTTACG AGATCGAATA CCGTGTCGTG 
CTGCCGAATG GGCGGGGCGG CTGGCTGCGC TCGCGGGGGC AGGTGCATCT CGACGCCGAA 
GGCCGGCCCC ACCGGCACCG CGGGGTCGTC TTCAGCATCG AAGAGCAGAA GCAGGTGGAG 
GCGGAGCTGC GCGCCCGCGA GGCTCATCTC CGCTCGATCC TCGACACGAT GCCGGAGGCG 
ATGGTGGTCA TCGACGAGGC AGGGCTGATC CACTCGTTCA ACCCGGCGGC CGAACGCCTC 
TTCGGCTACG CGGCCGGCGA GGCGATCGGG CAGGACGTCC GCATCCTGAT GCCGGAGGCG 
ATGCAGGATG GACATGCCGC CGACCTCGAG CGCTACCGGC AGACGCGCCA GCGCCACATC 
ATCGGCACCA CGCGGTGCGT GACGGGCCGA CGGCATGACG GCTCGACCTT TCCGATGGAG 
CTGGCCATCG GCGAGATGCA TTCGGGCGAG CGGACCTTCT TCACCGGCTT CATCAACGAC 
CTCAGCGCGC AGCGGCGCAC CGAGGCGCGG CTTCAGGAAC TCCAGTCCGA GCTGGGCCAT 
GTTTCCCGCT TGAGCGCCAT GGGCGAGATG GCGACGACGC TCGCCCACGA GCTGAATCAG 
CCGCTCGGCG CCATCACCAA CTACACCAAC GGCTGCCGCC GCCTCCTCGC CCATCCCGAC 
CCCGAGACCA TCGCCCGGGC ACAGGAGGTT CTCGACAAGG CGGCCGAGCA GGCGCTGCGG 
GCCCGGCAGA TCATCGCCCG CCTGCGGGAG TTCGTCGCCC GTGGCGAGAC GGAGAAACGG 
GTCGAGCCGG TCGCGACGAT GATCGAGGAG GCCGGCGCCC TGACCCTGGC GGCGGCCGGC 
GAGCAGGGCA TCACGGCCCA CGTCGTGCCG GATCCGCGGG TCGGATCGGT CTTGGTCGAC 
CGGGTTCAGG TGCAGCAGGT TCTGGTCAAC CTGATGCGCA ATGCCTGCGA GGCGATGCAG 
CGCAGCAGCC GGCGCGAGCT GACCGTCGCG ACGCGGCGGG TTTCGCCGGA TCTGGCCGAG 
GTCGCGGTGT CGGATACCGG CCCCGGTATC GCCGAGGAGG TGGCCGACCG GCTGTTCCAG 
CCCTTCGTCA CCACCAAGGA TGCCGGGATG GGCGTCGGCC TTTCGATTTC CCGCACCATC 
ATCGAGGCGC ATGGCGGCCG CCTCTGGGTC GAGCCCAACG CCGCGGGCGG GGCGACCTTC 
CGGCTGACCC TGCCGACCGC ACCCGAGAGA GGTCGGTAA

Protein sequence

MTLSMAAAEA IQGGGEALTA EDFRQTLHEV GVCIWSLDIS TGRVSASQTC GCLFGIPTER 
LTSFAATQDL VHPDDRQARA HAIESVLRDG GSYEIEYRVV LPNGRGGWLR SRGQVHLDAE 
GRPHRHRGVV FSIEEQKQVE AELRAREAHL RSILDTMPEA MVVIDEAGLI HSFNPAAERL 
FGYAAGEAIG QDVRILMPEA MQDGHAADLE RYRQTRQRHI IGTTRCVTGR RHDGSTFPME 
LAIGEMHSGE RTFFTGFIND LSAQRRTEAR LQELQSELGH VSRLSAMGEM ATTLAHELNQ 
PLGAITNYTN GCRRLLAHPD PETIARAQEV LDKAAEQALR ARQIIARLRE FVARGETEKR 
VEPVATMIEE AGALTLAAAG EQGITAHVVP DPRVGSVLVD RVQVQQVLVN LMRNACEAMQ 
RSSRRELTVA TRRVSPDLAE VAVSDTGPGI AEEVADRLFQ PFVTTKDAGM GVGLSISRTI 
IEAHGGRLWV EPNAAGGATF RLTLPTAPER GR