Gene M446_3023 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	M446_3023
Symbol
ID	6129061
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium sp. 4-46
Kingdom	Bacteria
Replicon accession	NC_010511
Strand	+
Start bp	3344166
End bp	3345386
Gene Length	1221 bp
Protein Length	406 aa
Translation table	11
GC content	71%
IMG OID	641643214
Product	putative UreA/short-chain amide ABC transporter
Protein accession	YP_001769868
Protein GI	170741213
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0683] ABC-type branched-chain amino acid transport systems, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.040363
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGGAAAA CGCTCCTAGC CGCCGCGTGC GTGGCCGCGT GGCACGGCGC GGCCTGCGCC 
CAGCAGGCCG CCCCGCCGGG CATCTCGGAC GGGGTCGTCC GGATCGGGTT CCTGCTCGAC 
ATGTCGAGCG TCTACGCGGA CGTCACCGGG CCGGGCAGCG CCGCGGCGGC GCGCATGGCG 
GTGGAGGATT TCGGCGGCAA GGTGCTGGGC GCGCCGATCG AGGTCCTGGT GGCGGACCAC 
CAGAACAAGG CCGACATCGC CGCCGCGACC GCCCGGGCGT GGTTCGACAC CGAGAAGGTC 
GACGCGATCC TCGACGTCGC CGCCTCCGCG ACGGCGCTCG CGGCGGCGGA CATCGCCAAG 
GCCAAGCACA GGATCATCGC CTTCAGCGGG CCGGGGGCCG TGCGGCTCAC CAACGAGGCC 
TGCTCGCCCG TCTCGATCCA CTGGGCCTAC GACACCTACG CGCTCGCCAA CGTGACGGCC 
CAGGCCACCG TGAAGGCGGG GGGCGATTCC TGGTTCTTCA TCACGGCCGA CTACGCCTTC 
GGGCACGACC TGGAGCGGGA CGCGGGGGCG GTCGTCCGGG CCCAGGGCGG CACCGTGGCG 
GGGAGCGTGC GGGCCCCCCT CAACACCCCG GATTTCTCCT CGTTCCTGCT CCAGGCGCAG 
GCCTCCGGCG CCAAGGTGGT CGGGCTCGCC AATGCGGGCC GCGACACCAC CAACGCCATC 
AAGCAGGCCG CCGAGTTCGG CCTGACCCAG GGCGGCCAGA AGCTCGCCGG GCTCCTCGTC 
TACATCAACG ACGTGCACAG CCTCGGCCTC GCCCCGACCC AGGGCATGCT GCTGACCGAG 
GGCTTCTACT GGGACCTCGA CGAGGGCACG CGCGCCTTCT CGAAACGCTA CTTCGCCCGG 
ACCGGCCGGA TGCCGAACAT GTCCCAGGCG GGGGTCTACT CGACGGTGAC GCACTACCTG 
AAGGCCGTCG CCAAGGCCGG CACCGACGAG ACCGACGCGG TGATGCGGGC GATGCGCGAG 
ACGCCGGTGG ACGATTTCTA CGCCCATGGC GGGCGCATCC GCGAGGACGG GCGCATGGTG 
CACGACATGT ACCTGTTCGA GGTGAAGCGG CCCGGGGAAT CGACCGGCGA GTGGGACCTC 
TACCGGCGCG TGGCGACCAT CCCGGGCGAT CAGGCCTTCC AGCCGCTCTC GGCCTCCCGC 
TGCCCGCTGG TGAAGAAGTG A

Protein sequence

MRKTLLAAAC VAAWHGAACA QQAAPPGISD GVVRIGFLLD MSSVYADVTG PGSAAAARMA 
VEDFGGKVLG APIEVLVADH QNKADIAAAT ARAWFDTEKV DAILDVAASA TALAAADIAK 
AKHRIIAFSG PGAVRLTNEA CSPVSIHWAY DTYALANVTA QATVKAGGDS WFFITADYAF 
GHDLERDAGA VVRAQGGTVA GSVRAPLNTP DFSSFLLQAQ ASGAKVVGLA NAGRDTTNAI 
KQAAEFGLTQ GGQKLAGLLV YINDVHSLGL APTQGMLLTE GFYWDLDEGT RAFSKRYFAR 
TGRMPNMSQA GVYSTVTHYL KAVAKAGTDE TDAVMRAMRE TPVDDFYAHG GRIREDGRMV 
HDMYLFEVKR PGESTGEWDL YRRVATIPGD QAFQPLSASR CPLVKK