Gene Cphy_2153 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cphy_2153
Symbol
ID	5744159
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium phytofermentans ISDg
Kingdom	Bacteria
Replicon accession	NC_010001
Strand	+
Start bp	2663601
End bp	2664650
Gene Length	1050 bp
Protein Length	349 aa
Translation table	11
GC content	33%
IMG OID	641293248
Product	arsenical-resistance protein
Protein accession	YP_001559258
Protein GI	160880290
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0798] Arsenite efflux pump ACR3 and related permeases
TIGRFAM ID	[TIGR00832] arsenical-resistance protein

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTGAAA AAAAAGAAGG AATTGGTTTT TTTGAAAAGT ATTTAACCTT ATGGGTTATC 
GTATGTATGG TAATCGGTGT ACTTGTAGGT AAATTTCTGC CTGTATTACC TAAATTCTTA 
GGTAAATTCG AATATGCCAA TGTGTCTATA CCAATTGCTG TTCTTATTTG GCTTATGATT 
TATCCTATGA TGATGAAGGT TGATTTTAAA AGTGTAAAAA ATGTTGGTAA AAATCCGAAA 
GGGCTCTATG TTACTTGGGT TACAAATTGG GTTATTAAAC CGTTTACTAT GTTCGGAATC 
GCATATTTTT TCTTCTATGT AGTATTTCGT GGTTTGATAT CACCAGAATT GGCTAAGGAT 
TACCTTGCAG GTGCTGTTTT ATTAGGAGCT GCACCATGTA CAGCAATGGT TTTTGTTTGG 
AGTCACTTGA CAAAAGGAAA TCCATCCTAT ACGGTAGTAC AGGTTGCAAC TAACGACCTG 
ATTATATTAA TAGCATTTAT ACCAATCGTG AAATTCCTTC TTGGCGTTTC TAATGTATCT 
GTCCCATGGG ATACCTTAAT ATTGTCAGTC GTACTTTTTG TAGTAATCCC ATTAGTAGGA 
GGAATTTTAA CCAGAACGTT CGTAGTAAGG AAGAAGGGTG AAGAGTATTT TAAAAATAGT 
TTTATACCTA AATTTAATAA TACTACTATT GTAGGACTTT TACTTACATT AATCATCATT 
TTCTCTTTTC AAGGAGATGT AATTGTAAAT AATCCATTAC ACATTGTACT AATTGCAGTT 
CCATTGATTA TACAAACGTT TTTAATCTTC TTCATTGCAT ATATGACTTC GAAAGTATTA 
AAACTTTCAC ATGATATTGC TGCTCCAGCT GGAATGATAG GAGCATCTAA TTTCTTTGAA 
CTTTCCGTTG CCGTAGCAAT TGCTTTATTT GGAGCGACTT CACCGGTTGC TTTAGCAACT 
ATAGTCGGCG TACTAGTAGA AGTACCTGTT ATGCTAATAC TAGTTAAGAT AGCTAATAAT 
ACAAAAAAAT GGTTTAAAAC AAATAATTAA

Protein sequence

MSEKKEGIGF FEKYLTLWVI VCMVIGVLVG KFLPVLPKFL GKFEYANVSI PIAVLIWLMI 
YPMMMKVDFK SVKNVGKNPK GLYVTWVTNW VIKPFTMFGI AYFFFYVVFR GLISPELAKD 
YLAGAVLLGA APCTAMVFVW SHLTKGNPSY TVVQVATNDL IILIAFIPIV KFLLGVSNVS 
VPWDTLILSV VLFVVIPLVG GILTRTFVVR KKGEEYFKNS FIPKFNNTTI VGLLLTLIII 
FSFQGDVIVN NPLHIVLIAV PLIIQTFLIF FIAYMTSKVL KLSHDIAAPA GMIGASNFFE 
LSVAVAIALF GATSPVALAT IVGVLVEVPV MLILVKIANN TKKWFKTNN