Gene Msil_1384 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msil_1384
Symbol
ID	7091722
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylocella silvestris BL2
Kingdom	Bacteria
Replicon accession	NC_011666
Strand	-
Start bp	1495648
End bp	1496664
Gene Length	1017 bp
Protein Length	338 aa
Translation table	11
GC content	71%
IMG OID	643464722
Product	urea amidolyase related protein
Protein accession	YP_002361711
Protein GI	217977564
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1984] Allophanate hydrolase subunit 2
TIGRFAM ID	[TIGR00724] biotin-dependent carboxylase uncharacterized domain

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	41
Fosmid unclonability p-value	0.669414
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGCTAGAA CCCTGCGCAT CCTTGGCGCT GGCCCCGGCG CGACGATTCA GGACGCGGGC 
CGAACCGGCT ATATGCGCTA TGGCGTGACG CCGGCGGGGC CGATGGACCC GGCCGCCTTC 
GCCACGGTCG CCGCGGCGCT GGAGAACGAG CCGCACGCGG CTGCAATCGA AATTTCGGTG 
GGCGGTCTCA GCGTCGGTGC GGACGATGAA CCCCTCTGCG TCGCTTTCGC GGGCGGGGCT 
TTCGATTGGC GGCGCAATGG CGACGCGCTG CCGGTCGCGG CGCGCATACG TCTGGCGCCG 
GGGGAGACCC TGTCCGCGCG GGCGGGGGCG TTCGGGGCCT GGGCCTATCT CGCCGTCGCC 
GGCGGCTTTG AGACGCCGCT CCGGCTTGGC TCCCGCGCGA CTCATTTGCG CTCGCAGATC 
GGCGGGCTTG AGGGGCGCAT GCTGCGCGCG GGCGATGCGC TGCCTTGCGG CTCCGGCGCC 
TTATTGACGG AGGCCGCGCT TGACGCGCCC TGGCTTGCCT CGTCGGTAGC GCCAATCCGC 
GTGCTGCCTG GCCCGCAGGA CGATTATTTC GCGCCCGAGG CGCTCGCCGC CTTCTTTGGC 
GAAGTCTTCA CCCTGACCCC GCGCGCCGAC CGGATGGCCT ATGCGTTCAG CGGTCCGCCG 
ATCGACCATG CGCGCGGCTA TAATATCGTC TCCGATGGCG TCGCCCTTGG CGCCATTCAG 
ATCGCCGGCG ATCGCGCGCC GCTGATCCTG ATGGCGGACC GCCAGCCGAC CGGCGGCTAT 
CCCAAGCTAG GCCATGTCAT CGGAGCCGAT ATCGGCCGCC TCGCGCAATT GCGGCCGGGC 
GAGCGCTGCC GCTTCAAAGC GGTCGGCCTG GGCGAGGCGC TGGCGGCGCA GGAGGAGTTG 
CAGGCGCAGA TTTTGACGAC CGAGCAGCGC CTGCGTCCGC TTGTCCGGCG CGCGACAACC 
GAGGCGCTGC TGCGCGCAAA TCTGATCGAT GGGGCGACCG ACGCGCTCGC CGATTGA

Protein sequence

MARTLRILGA GPGATIQDAG RTGYMRYGVT PAGPMDPAAF ATVAAALENE PHAAAIEISV 
GGLSVGADDE PLCVAFAGGA FDWRRNGDAL PVAARIRLAP GETLSARAGA FGAWAYLAVA 
GGFETPLRLG SRATHLRSQI GGLEGRMLRA GDALPCGSGA LLTEAALDAP WLASSVAPIR 
VLPGPQDDYF APEALAAFFG EVFTLTPRAD RMAYAFSGPP IDHARGYNIV SDGVALGAIQ 
IAGDRAPLIL MADRQPTGGY PKLGHVIGAD IGRLAQLRPG ERCRFKAVGL GEALAAQEEL 
QAQILTTEQR LRPLVRRATT EALLRANLID GATDALAD