Gene MCA2101 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	MCA2101
Symbol
ID	3102802
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylococcus capsulatus str. Bath
Kingdom	Bacteria
Replicon accession	NC_002977
Strand	+
Start bp	2260437
End bp	2261507
Gene Length	1071 bp
Protein Length	356 aa
Translation table	11
GC content	63%
IMG OID	637171255
Product	hypothetical protein
Protein accession	YP_114531
Protein GI	53803847
COG category	[R] General function prediction only
COG ID	[COG0795] Predicted permeases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATACGC TGAACCGCTA CATCGGCTGG GAAGTCATCA AGGGGGCGGC ATTCGCTGCC 
CTGGTCCTCC TCGCCCTCCT GAATTTCTTC ACCTTCGCCG ACGAACTGCG CGACCTGGGT 
GAGGGCAACT ACGGGCTGGG CAGCATCTTC CTCTATCTGA CGCTGACCTC GCCCCACAGC 
CTGTACGAAC TCATCCCTTC CGGCGCACTG ATCGGCGGCC TGGTGGTGCT CGGCAACATG 
GCAAACAACC ACGAATTGGT GGCGATGCAG GCCGCCGGCG TTTCCCGGGG TCGCATCGTC 
TGGGCGGTCC TGCGGGCGGG CATCGTGATC TCGCTGATAT CGGTCGTCAT CAGCGAATAC 
GTCATTCCGC CGGCGGAACG GGCCGCCCAG ATGCTCAAGG CCACCGCAAC CCGCCAACAG 
GTCGCCTCCC AGACCAAGTA CGGAGTCTGG ATCCGGGACG GTAACGTTTA CGTCAACGTC 
CGGGAAATCG AGAACCAGGA ACGCCTGGGC GACATCCACA TCTTCGAAAT ATCGCCGGAC 
GGCCGCCCGG CCTTGGCCAT GCATGCCGCG CGCGCCAGTT TCGACCGCGG CATCTGGAAA 
CTCGAGGACA TCGGCCTCAC CCGCTTCGAC CCCGCGGGGA ACGCCGCCAT CGCCGAACAC 
AAGGAACAGG AGGATTGGTC CTCCGTCCTA TCCCCGGACA TGCTCGACGT GTTCATCGTC 
CGCCCGGAAA ACCTGTCGGC ACAGGACCTC GCGAAGTACA TGGCCTATCA GACCGAAAAC 
GCGCAGAAAT CGCTGGCCGT GGAGCAAGCC TTCTGGGGAC GCATGGTCAA CCCGCTCATC 
ACGCTGGCCA TGCTCCTACT GGCCATCCCT TTCGTGTTCA ACGCCCGCCG TGACGTCAGC 
AGCGGGCAAC GGATCGTGAT CGGCGTCACG ATCGGCCTCG GCTTTTACCT GACCAACAGA 
ATGGTGTCCC ATCTGGGACT GGTCTACGAA GTGAATGCCC CACTGACGAT GGTAACACCT 
CCCCTGGTCG TCCTCTTCGC CGCCCTCGCC GCCTTCAGAC GCCGCCCCTA G

Protein sequence

MNTLNRYIGW EVIKGAAFAA LVLLALLNFF TFADELRDLG EGNYGLGSIF LYLTLTSPHS 
LYELIPSGAL IGGLVVLGNM ANNHELVAMQ AAGVSRGRIV WAVLRAGIVI SLISVVISEY 
VIPPAERAAQ MLKATATRQQ VASQTKYGVW IRDGNVYVNV REIENQERLG DIHIFEISPD 
GRPALAMHAA RASFDRGIWK LEDIGLTRFD PAGNAAIAEH KEQEDWSSVL SPDMLDVFIV 
RPENLSAQDL AKYMAYQTEN AQKSLAVEQA FWGRMVNPLI TLAMLLLAIP FVFNARRDVS 
SGQRIVIGVT IGLGFYLTNR MVSHLGLVYE VNAPLTMVTP PLVVLFAALA AFRRRP