Gene Anae109_4410 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Anae109_4410
Symbol
ID	5376205
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaeromyxobacter sp. Fw109-5
Kingdom	Bacteria
Replicon accession	NC_009675
Strand	+
Start bp	5159616
End bp	5160644
Gene Length	1029 bp
Protein Length	342 aa
Translation table	11
GC content	73%
IMG OID	640845938
Product	sulfate ABC transporter, periplasmic sulfate-binding protein
Protein accession	YP_001381572
Protein GI	153007247
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG1613] ABC-type sulfate transport system, periplasmic component
TIGRFAM ID	[TIGR00971] sulfate/thiosulfate-binding protein

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	0.476755
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	55
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGGCAA GCCGGTGGAA GGTCCTTGGG CTCGCGGCGC TGGTGGCCGT CGCATTCGCG 
GGCGGCGGCG AGACGGCGCG GGCGGTGGAG GGAGGCGAGG CGAAGCTGCT CAACGTGTCG 
TACGACCCCA CGCGCGAGCT CTACGACGAC GTCAACCAGG CGTTCGCGGC GCGCTGGAAG 
GCGAAGACCG GTCAGGCCGT CACCGTGCGG CAGTCCCACG GGGGCTCCGG CAAGCAGGCG 
CGGGCGGTGA TCGACGGGCT CGAGGCGGAC GTGGTCACGC TCGCCCTCGC CTACGACGTG 
GACGCGATCG CCGCGCGCGG GCTGCTCCCC GCCGACTGGC AGAAGCGGCT GCCGGAGCGC 
GCGGCGCCGT ACACCTCGAC CATCGTGTTC CTCGTGCGCA AGGGGAACCC CAAGGGCCTG 
CGCGACTGGG ACGACCTCGT GAAACCCGGG GTCCAGGTCA TCACCCCCAA CCCGAAGACG 
TCCGGCGGCG CGCGCTGGAA CTACCTCGCG GCCTGGGCGC ACGCCCTCGA GAAGGGCGGC 
GGCGACGAGG CCAAGGCGCG CGAGTTCGTG ACGGCCCTGT TCCGGAACGT CCCGGTGCTC 
GACTCCGGCG CTCGGGGCTC CACGACCACC TTCGTCGAGC GCGGCCTCGG CGACGTCCTG 
CTCGCCTGGG AGAACGAGGC GTTCCTGGCG ATCGAGCAGC TCGGCAAGGG TCGGTTCGAG 
ATCGTCGCGC CGCGCACCAG CATCCTCGCG GAGCCGCCCG TGGCGGTGGT CGAGAAGAAC 
GCGGACCGGC ACGGCACGCG CGCCCTCGCC CAGGCGTACC TCGAGTTCCT CTACACGCCG 
GAGGGCCAGG AGCTCGTCGC GAAGCACTTC TACCGCCCGC GCGACCGCGC CGTCGCGGCC 
CGCCACGCCG GCCGCTTCCC CGCCATGCGC CTCGTGACGA TCGACGCGTT CGGCGGCTGG 
CAGAAGGCGC AGGCCGCCCA CTTCGCGGAC GGCGGCGTCT TCGACCAGAT CTACGCGCCC 
GGCCGCTGA

Protein sequence

MKASRWKVLG LAALVAVAFA GGGETARAVE GGEAKLLNVS YDPTRELYDD VNQAFAARWK 
AKTGQAVTVR QSHGGSGKQA RAVIDGLEAD VVTLALAYDV DAIAARGLLP ADWQKRLPER 
AAPYTSTIVF LVRKGNPKGL RDWDDLVKPG VQVITPNPKT SGGARWNYLA AWAHALEKGG 
GDEAKAREFV TALFRNVPVL DSGARGSTTT FVERGLGDVL LAWENEAFLA IEQLGKGRFE 
IVAPRTSILA EPPVAVVEKN ADRHGTRALA QAYLEFLYTP EGQELVAKHF YRPRDRAVAA 
RHAGRFPAMR LVTIDAFGGW QKAQAAHFAD GGVFDQIYAP GR