Gene MCA0899 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	MCA0899
Symbol
ID	3103922
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylococcus capsulatus str. Bath
Kingdom	Bacteria
Replicon accession	NC_002977
Strand	-
Start bp	943502
End bp	944518
Gene Length	1017 bp
Protein Length	338 aa
Translation table	11
GC content	64%
IMG OID	637170092
Product	sulfate starvation-induced protein 2
Protein accession	YP_113385
Protein GI	53804804
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG1613] ABC-type sulfate transport system, periplasmic component
TIGRFAM ID	[TIGR00971] sulfate/thiosulfate-binding protein

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.368441
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAACTCT CGATCAAGGC AGGCGCAGCC GCATCCCTGC TCGCGCTCGC AGCACTATTC 
GGCGCCGGCA CGGCCCCGGC CTCGGACCTG ACCCTGCTCA ACGTGTCATA CGATCCGACC 
CGCGAGTTCT ATCAGGATTA CAACGCCGCC TTCGCCAAGC ACTGGAAGGA AAAAACCGGC 
CAGACGCTCG AGATCCGCCA GTCGCACGGC GGCTCGGGCA AGCAGGCGCG GGCGGTGATC 
GACGGACTGG ACGCCGATGT CGTCACCCTC GCTCTGGCCT ACGACGTGCA CCAGTTGCAC 
GAGAAGCGCA AGCTGATCTC GGCGGACTGG CAGGCCAAGC TGCCCCACAA CAGCGCCCCC 
TACACCTCCA CCATGGTATT CCTGGTGCGC AAGGGCAACC CTCTGGGCAT CAAAGACTGG 
GACGATCTGG CCAAGACCGG CGTATCGGTA GTGACGCCCA ACCCGAAGAC CTCGGGCGGC 
GCGCGCTGGA ACTACCTGGC CGCGTGGGGC TACGCCCTGA AGAAGTACGG CAACGAGCAG 
GCGGCGCGGG ACCTGGTCGC GAAGATCTAC AAGAACGCCG CCGTGCTCGA CACCGGCGCC 
CGCGGCTCGA CCATCACCTT CGCCGAACGG GAAATCGGCG ACGTGCTGAT CACCTGGGAA 
AACGAGGCTT ACCTCATCCT GAAAGAGTAC GGCGCCGACA ACTTCGAGAT CGTCGCACCC 
TCCATCAGCA TACTGGCCGA ACCCACGGTC ACCGTCGTCG ACGACATCGT CCGCCAGCGC 
GGCACCGGCG ACGTCGCCAA AGCCTACCTG GACTACCTTT ACAGCCCGGA AGGCCAGGAA 
TTGGCGGCCA AGCACCACTA CCGGCCACGC GACCAGGCGG TACTGGCCAG ACACGCCAAG 
GATTTCGCCC CCATCCAACT GTTCACGATC GATGAATTGT TCGGCGGCTG GGGCAAGGCG 
CAGAAGATCC ACTTCGCCGA CGGCGGCGTC TTCGACCAGA TTTACAGCGC CAAGTGA

Protein sequence

MKLSIKAGAA ASLLALAALF GAGTAPASDL TLLNVSYDPT REFYQDYNAA FAKHWKEKTG 
QTLEIRQSHG GSGKQARAVI DGLDADVVTL ALAYDVHQLH EKRKLISADW QAKLPHNSAP 
YTSTMVFLVR KGNPLGIKDW DDLAKTGVSV VTPNPKTSGG ARWNYLAAWG YALKKYGNEQ 
AARDLVAKIY KNAAVLDTGA RGSTITFAER EIGDVLITWE NEAYLILKEY GADNFEIVAP 
SISILAEPTV TVVDDIVRQR GTGDVAKAYL DYLYSPEGQE LAAKHHYRPR DQAVLARHAK 
DFAPIQLFTI DELFGGWGKA QKIHFADGGV FDQIYSAK