Gene CPR_1609 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPR_1609
Symbol
ID	4206186
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens SM101
Kingdom	Bacteria
Replicon accession	NC_008262
Strand	-
Start bp	1799803
End bp	1801578
Gene Length	1776 bp
Protein Length	591 aa
Translation table	11
GC content	38%
IMG OID	642566160
Product	V-type ATP synthase subunit A
Protein accession	YP_698925
Protein GI	110803741
COG category	[C] Energy production and conversion
COG ID	[COG1155] Archaeal/vacuolar-type H+-ATPase subunit A
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.061044
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGAAAACGG GGAAAATTAT CAAGGTTTCA GGTCCTTTAG TAGTTGCTGA AGGTATGGAT 
GAAGCTAATG TATATGACGT TGTAAAAGTT GGAGAAAAAG GTCTTATCGG AGAGATCATT 
GAAATGAGAG GAGATAAGGC TTCAATCCAG GTATATGAAG AAACATCAGG TATTGGACCT 
GGGGACCCAG TTATAACTAC TGGAGAACCA CTTTCAGTAG AATTAGGACC AGGACTTATA 
GAGTCAATGT TCGATGGAAT ACAAAGACCT CTAGACGCTT TCATGAAAGC AGCTAATTCT 
GCTTTCTTAA GTAAAGGGGT AGAAGTTAAA TCTTTAAATA GAGAGAAAAA ATGGCCTTTT 
GTGCCAACTG CTAAAGTTGG AGATAAGGTT TCAGCTGGAG ACGTAATAGG AACAGTTCAA 
GAGACTGCCG TTGTTCTTCA TAGAATAATG GTTCCTTTCG GCGTTGAAGG TACAATAAAA 
GAAATCAAAG CTGGAGATTT CAATGTAGAA GAAGTTATCG CTGTAGTAGA AACTGAAAAA 
GGTGATAAGA ATTTAACATT AATGCAAAAA TGGCCTGTAA GAAAAGGTAG ACCATATGCA 
AGAAAATTAA ATCCAGTTGA GCCAATGACT ACAGGACAAA GAGTTATAGA TACTTTCTTC 
CCAGTAGCTA AAGGTGGAGC TGCTGCCGTT CCAGGACCTT TCGGAGCTGG TAAAACAGTA 
GTTCAGCACC AAGTTGCTAA ATGGGGAGAT ACTGAGATAG TTGTTTATGT TGGATGTGGA 
GAACGTGGTA ACGAAATGAC AGACGTTCTT AACGAATTCC CAGAACTTAA AGACCCTAAA 
ACTGGGGAAA GCTTAATGAA GAGAACAGTT CTTATCGCTA ATACATCTAA CATGCCAGTT 
GCTGCCAGAG AAGCATCAAT ATATACTGGT ATAACAATAG CAGAGTATTT CAGAGATATG 
GGATACTCAG TATCAATCAT GGCTGACTCA ACTTCACGTT GGGCAGAGGC TTTAAGAGAA 
ATGTCAGGAA GACTTGAAGA AATGCCAGGA GACGAAGGTT ACCCAGCATA CTTAGGATCA 
AGACTTGCTG ATTACTATGA AAGAGCTGGT AAGGTTGTAG CTTTAGGTAA AGATGGAAGA 
GAAGGAGCTG TTACAGCTAT CGGAGCAGTA TCCCCTCCAG GAGGAGATAT ATCTGAGCCA 
GTTACACAAT CAACTTTAAG AATAGTTAAA GTTTTCTGGG GACTAGATGC TCAATTAGCA 
TATAAGAGAC ACTTCCCATC AATTAACTGG TTAACATCAT ACTCATTATA CTTAGAAAAA 
ATGGGTGAAT GGATGGATGC TCACGTAGCA GACGATTGGT CAGCATTAAG AACAGAAGCT 
ATGGCACTTC TTCAAGAAGA AGCAAACTTA GAAGAAATAG TAAGACTTGT TGGTATGGAT 
GCACTTTCAG AAGGTGATAG ATTAAAACTT GAAGTTGCTA AGTCAATAAG AGAAGACTAT 
TTACAACAAA ACGCATTCCA TGAGAATGAC ACATATACTT CATTAAATAA ACAGTATAAA 
ATGTTAAACT TAATCTTAAG TTTCAGACAT GAGGCTGAAA AAGCTTTAGA AGCTGGAGTT 
TATTTAGATA AAGTATTAAA ACTTCCTGTT AGAGATAGAA TTGCAAGAAG TAAATATATT 
TCAGAAGAAG AGATAAGTAA GATGGATGAC ATCTTAGTTG AATTAAAATC AGAGATGAAC 
AAGTTAATCA GCGAGGGAGG TGTTCTAAAT GCTTAA

Protein sequence

MKTGKIIKVS GPLVVAEGMD EANVYDVVKV GEKGLIGEII EMRGDKASIQ VYEETSGIGP 
GDPVITTGEP LSVELGPGLI ESMFDGIQRP LDAFMKAANS AFLSKGVEVK SLNREKKWPF 
VPTAKVGDKV SAGDVIGTVQ ETAVVLHRIM VPFGVEGTIK EIKAGDFNVE EVIAVVETEK 
GDKNLTLMQK WPVRKGRPYA RKLNPVEPMT TGQRVIDTFF PVAKGGAAAV PGPFGAGKTV 
VQHQVAKWGD TEIVVYVGCG ERGNEMTDVL NEFPELKDPK TGESLMKRTV LIANTSNMPV 
AAREASIYTG ITIAEYFRDM GYSVSIMADS TSRWAEALRE MSGRLEEMPG DEGYPAYLGS 
RLADYYERAG KVVALGKDGR EGAVTAIGAV SPPGGDISEP VTQSTLRIVK VFWGLDAQLA 
YKRHFPSINW LTSYSLYLEK MGEWMDAHVA DDWSALRTEA MALLQEEANL EEIVRLVGMD 
ALSEGDRLKL EVAKSIREDY LQQNAFHEND TYTSLNKQYK MLNLILSFRH EAEKALEAGV 
YLDKVLKLPV RDRIARSKYI SEEEISKMDD ILVELKSEMN KLISEGGVLN A