Gene Msil_1810 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msil_1810
Symbol
ID	7090927
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylocella silvestris BL2
Kingdom	Bacteria
Replicon accession	NC_011666
Strand	-
Start bp	1970748
End bp	1971908
Gene Length	1161 bp
Protein Length	386 aa
Translation table	11
GC content	65%
IMG OID	643465137
Product	protein of unknown function DUF451
Protein accession	YP_002362117
Protein GI	217977970
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG2822] Predicted periplasmic lipoprotein involved in iron transport
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	42
Fosmid unclonability p-value	0.742224
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACGCGA CGCCCTCTAA AAAACCCCCG GCGGGATGGG GCATAAAGCT GCTCGTCGGC 
GCCGCTGCGC TGCTTGTCCT TGTGGCGGGA GTCGCCTTCT ATCTGGCGTC GAAAAAGGCG 
CGCGCGCCGG AAGGCGCCAA GATCGTCAGC ATCACCGTCA ATGCCGATTC CTGCAACCCG 
AACGAGCTCT CCGTGCCGGC TGGGCGAACC GTGTTCGAAA TCGTCAACGC CTCACAGCGC 
GTCGTCGAGT GGGAGATTCT CGACGGGGTC ATGGTGCTTG AGGAGCGCGA GAACATCGCC 
CCCGGGATCA CCGCGCGGCT CACGGCAAAG CTCAATCCGG GCGTGTTCGA AATCACCTGC 
GGCATGCTCA ACAATCCGCG CGGCAAGCTG ACCGTCACGC CATCCGCCCA ATCCGAGGCT 
GAGGCGGCGC GGCCGCCGGC GACGGCGTTC ATCGGTCCGC TCGCCGAATA TCAGGTCTAT 
CTCGCACTCG AGACGGAAGA TCTGATCGAG GCGACGCAGA ATCTCAGCGA GGCGATCAAG 
GCCGGCGACC TCGATCGCGC CCGATCGCTC TATGAGCCGG CGCGCAGGCC CTATCTGCAT 
GTCGCCCCGG CCGCGCAGCG GTTTGGCGAT CTCGACGCGG CGATCAACGC CGAGCCGGAT 
TATTTTGAAA AGCGCGAGCA AGATCCCGCC TTCTCCGGCT TCCATCGCCT CGAATATGGG 
CTTTTCGGCC AAACTAGCCT CGCTGGCCTT GCTCCCGTTG CCGAAAAACT GGCGAGCGAC 
GTCGCGACGC TGAAGGAGCG CATTCGCGCT TTGAAAATCG CTCCCGAGGA TATTGCCGCC 
GGCGCCTCGA AACGACTCGC CAAGAGCGCG GACGCCGCAG CCTCGGGAGT CAGCGAGCGC 
TACGCCCATA CCGACCAGGC CGATTTCGAG GCCGACGTCG CCGGCGCCGC CAAGAGCTTT 
GACGTGCTGC GCCCGCTGAT CGCCAAAGCC TCGCCGGATC TTCTCGCTCG CGTCGACGCG 
GGTTTCAAAT CCGCCAAGGC TTCGATCGCT GCTTTGAAGA CGGGCGCTGA CGCCGGCGCC 
GCGCGGGCGG CTGTGGCCGC CGATCTCCGT CAACTCTCGA GCGAACTCGG AAAGCTCAAC 
GCCGCCATCG GACTGGACTA G

Protein sequence

MDATPSKKPP AGWGIKLLVG AAALLVLVAG VAFYLASKKA RAPEGAKIVS ITVNADSCNP 
NELSVPAGRT VFEIVNASQR VVEWEILDGV MVLEERENIA PGITARLTAK LNPGVFEITC 
GMLNNPRGKL TVTPSAQSEA EAARPPATAF IGPLAEYQVY LALETEDLIE ATQNLSEAIK 
AGDLDRARSL YEPARRPYLH VAPAAQRFGD LDAAINAEPD YFEKREQDPA FSGFHRLEYG 
LFGQTSLAGL APVAEKLASD VATLKERIRA LKIAPEDIAA GASKRLAKSA DAAASGVSER 
YAHTDQADFE ADVAGAAKSF DVLRPLIAKA SPDLLARVDA GFKSAKASIA ALKTGADAGA 
ARAAVAADLR QLSSELGKLN AAIGLD