Gene Mnod_3047 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mnod_3047
Symbol
ID	7303974
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium nodulans ORS 2060
Kingdom	Bacteria
Replicon accession	NC_011894
Strand	+
Start bp	3141319
End bp	3142788
Gene Length	1470 bp
Protein Length	489 aa
Translation table	11
GC content	76%
IMG OID	643600746
Product	type IV / VI secretion system protein, DotU family
Protein accession	YP_002498291
Protein GI	220922989
COG category	[M] Cell wall/membrane/envelope biogenesis [S] Function unknown
COG ID	[COG2885] Outer membrane protein and related peptidoglycan-associated (lipo)proteins [COG3455] Uncharacterized protein conserved in bacteria
TIGRFAM ID	[TIGR03349] type IV / VI secretion system protein, DotU family [TIGR03350] type VI secretion system OmpA/MotB family protein

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.166638
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACGCGC CCTTCGATCC CTTCGGCCGC TCGGACCGCA CCATCATCCT GCCGAACCCG 
GCCGGACGGC GTGCGCCGCA GGCGGCCCTG CAGGCGACGA GCCCAGCCCC CGAGGCGCCG 
GTCGCCCGGC GCGTCCCGGC GAGCCTCCAG GCGCCCTTCC CGGCGCCCAG CTTCGCGGCG 
CCGCCCGCGA TGGGCGAGGA CGCCTGGGCG CGCCCCGATC CGCTGCCGCC CGCCCGTGAG 
CCCGCGCCGC CGGGGCGCGC CCTGGTGCTC AGGCGCGACG TGGTGGTGGC GCCGAACGAG 
AACCCGTTCC TGCGCGCGGC CGGGCCGCTC CTCCTGCTGA TCGGGCGCCT GCGCGTCCAG 
CTCTCGCGCG CCTCCTTCGC CAACCTGATG GAGCAGGTCG CCGCGGCGAT CGAGGAGTTC 
GAGCGCGAGG TGCGCGGCGC GGGCGCCTCG CCCGAGCAGA CGCGGACCGC CAAGTACGTC 
GTCTGCGCCA CGGCCGACGA CGTGGTGCAG AACATCCCGA CCGAGGACCG GCACGTCTGG 
ACGCAGTACT CGATGCTTAG CCGCTTCTTC GGCGAGCGCG TCGGCGGCGT GCGCTTCTTC 
GAGGAGCTGG AGCGGGCCAA GCTCGACCCG GCCGGCAACT ACGCGCTGCT GGAACTGCAG 
CATGCCTGCC TCGCGCTCGG CTTCCAGGGC ATCCACCGCA CCTCCGCGGG CGGGGCCGCC 
GCGCTCCAGG CGATCCAGCG CAATCTCTAC GAGACGCTGC GGCGGGCCCG CCCCGCCCCG 
GCCGAGATCT CGCCGCGCTG GCAGGGCCAG GACATCCCGG CGGCCGCAGC CCGGCCGGCG 
GTCCCGCTCT GGACGGTGGC GGCGGTCACG GCGGCGGCGC TGCTCGCCCT CTACCTCGCC 
CTGCGACTCC TGCTGGCGCG CGACGCCGAC ACGACCGCCG AGACCCTCGT CACCCTCCAC 
CCGACGACCG AACTCGGCAT TCAGCGGCGC GCCCCGGTTC CGCCGCCCCC ACCTCCGCCT 
CCGCCGCCTC CGAGCGGCCC GGCCGCGGCC CTGCGCGACG CGCTCGCCGC CGATGCCTCG 
GCCGGGCGGG TCACGGTCGA GGAGACGAAC TCCCAGGTCG TCGTGCGGCT CGCCGCCGCG 
CTCTTCGCAC CCGGCGACGC GGCCGTGACG GCGGAGTTCC GCCCGCTGCT GCAGCGCGTC 
GCCGGCCTGA TCGCCCGCGA GCCGGGGCCG ATCCGGATCG TCGGCCACAC CGACAGCGCG 
CCGGTCCGCA ACGGGCGCTT CGCCTCGAAC TTCGACCTCT CGGTCGCGCG CGCCAAGGCG 
GTCGCAGCGG CGATCCGGGC AGCGCCGGAG AAGCCCGAGC GCCTTGAGGT CGAAGGCAAG 
GGGCCGGACG CGCCCGTGGC CCCGAACGAC ACCGTCGAAG GACGCGCCCG CAACCGGCGC 
GTCGAGATCC TCATCCCCCG CGGCAGCTGA

Protein sequence

MNAPFDPFGR SDRTIILPNP AGRRAPQAAL QATSPAPEAP VARRVPASLQ APFPAPSFAA 
PPAMGEDAWA RPDPLPPARE PAPPGRALVL RRDVVVAPNE NPFLRAAGPL LLLIGRLRVQ 
LSRASFANLM EQVAAAIEEF EREVRGAGAS PEQTRTAKYV VCATADDVVQ NIPTEDRHVW 
TQYSMLSRFF GERVGGVRFF EELERAKLDP AGNYALLELQ HACLALGFQG IHRTSAGGAA 
ALQAIQRNLY ETLRRARPAP AEISPRWQGQ DIPAAAARPA VPLWTVAAVT AAALLALYLA 
LRLLLARDAD TTAETLVTLH PTTELGIQRR APVPPPPPPP PPPPSGPAAA LRDALAADAS 
AGRVTVEETN SQVVVRLAAA LFAPGDAAVT AEFRPLLQRV AGLIAREPGP IRIVGHTDSA 
PVRNGRFASN FDLSVARAKA VAAAIRAAPE KPERLEVEGK GPDAPVAPND TVEGRARNRR 
VEILIPRGS