Gene CPF_1900 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPF_1900
Symbol	spoVB
ID	4200971
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens ATCC 13124
Kingdom	Bacteria
Replicon accession	NC_008261
Strand	+
Start bp	2136345
End bp	2137874
Gene Length	1530 bp
Protein Length	509 aa
Translation table	11
GC content	27%
IMG OID	638082769
Product	stage V sporulation protein B
Protein accession	YP_696333
Protein GI	110799140
COG category	[V] Defense mechanisms
COG ID	[COG0534] Na+-driven multidrug efflux pump
TIGRFAM ID	[TIGR02900] stage V sporulation protein B

Plasmid Coverage information

Num covering plasmid clones	2
Plasmid unclonability p-value	0.0000710979
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGAGTAAAA ATGATTTCTA TAAAAACTCT TTCATGCTAA CAGCCTCTAA CTTAACAACT 
GGATTATTAG GTTTTATCTT TTCTATGTAC CTATCAAAGG TACTAGGCCC TGAAGGAATG 
GGACTTTATG GTATTATAAT GCCTATTTAT AATTTATTTA TATCAATTAT GACAGCTGGT 
ATAATTGCAT CCATTTCTAA GATAACTGCT GTATATTCAG CAAGAGATGA TTATAAAAAC 
ATAATTCGAA CAATGAAAGT TGTGGCTATT TTTAATTTTA TTTGGTGTCT TATAATAGGA 
ATATTTGTAT TTTTCTTATC ACCTATAATC GGACATTTTT GGGCTAAGGA TCCTAGAATA 
ATAAAATCTA TAATGGTAAC TTGTCCTGCT ATGATATTTA TAGCACTTTC AAACATATTA 
AAGGGATTTT TCTATGGAAC TTCAAAAATC ACTGTTCCTT CTTTTATAGA TATTTTAGAA 
AAATCTTTAC GTATCTTTGT TTTAGCTATA TTAATTTTTA TATTTAAAGC TGAAACTTTA 
GAGTCTTTAG TTACTTTAGC TTACTTAGCC TTATGTCTTG GGGAACTACA AAGTTTAATA 
CTTTTATTTG GATATTTTAA ATACTCAATG AGTAAATTTC CAAAAACAAA TGCAAAAGGG 
GAAAGCCGTG CTCAATTATT ATTTGATGTT TTAGTAACCT CAGTACCTTT ATGCTTAAAT 
GGATTTTTAA TGAGTATTTT TAGCGTTATC TCAACACTTT TAGTTCCTAA ACGGCTTATA 
GTTGCAGGAT TTACTTATTC CCAAGCACTT TCTCTTATAG GAAAATATTC TTCCATGGCA 
ATGTCCATAG TAACTTTTCC TATAATTATA GTTTCTTCAA TAAACACTAT GCTAATACCT 
GATTTATCTC AAACTTTAAG TAAAGGGAAT TATCTTTCAG CTACTAAAAG AATTAGAGAT 
GTTATTAAAA TAGCTTTTTT AATAGGTATT TGTACCACAG TAATTGGACT ATGTGTTCCT 
GACTCTTTAG GTAAATTATT CTTTGGAAGA GATGATTTAG GAGAATATAT AAGAATAACA 
TCAGTAATGA TGCCAATAGT ATTTACTTCA AATACTATGT ATGGAATTTT AAATGGACTT 
GGAAGACAAA ATGTAATTTT AAGAAATACT ATAATAACAG AAGTTTTAGA AGTTACATTG 
TTATTTTTCT TAACTGCAAT ACCATCTATA AATATTTATG GTTATGCAAT AACTATGCTT 
ATAATTTCAT CACTTTCCCT TTGTTTAAAC CTTTATGAAA TATATAAAAA TATAAATATA 
GGTTTATCCT TATCAAACTT CTTAATATAT ATATTAACAG GAGTTTTAAC CTATATATGC 
TTAAGTCCAC TTTCACTAAA GCTTTCTTTT ATTGATTTTA GGATTCAAGT TTTAGCTGTA 
ACTTCTATAG CAGCTTCTAT ATTCATATTT TTAATAATAA AGGAGAAATT CTCATCAAGG 
TTTAGAAAAA TCTCTTTAAA AAGCAGATAG

Protein sequence

MSKNDFYKNS FMLTASNLTT GLLGFIFSMY LSKVLGPEGM GLYGIIMPIY NLFISIMTAG 
IIASISKITA VYSARDDYKN IIRTMKVVAI FNFIWCLIIG IFVFFLSPII GHFWAKDPRI 
IKSIMVTCPA MIFIALSNIL KGFFYGTSKI TVPSFIDILE KSLRIFVLAI LIFIFKAETL 
ESLVTLAYLA LCLGELQSLI LLFGYFKYSM SKFPKTNAKG ESRAQLLFDV LVTSVPLCLN 
GFLMSIFSVI STLLVPKRLI VAGFTYSQAL SLIGKYSSMA MSIVTFPIII VSSINTMLIP 
DLSQTLSKGN YLSATKRIRD VIKIAFLIGI CTTVIGLCVP DSLGKLFFGR DDLGEYIRIT 
SVMMPIVFTS NTMYGILNGL GRQNVILRNT IITEVLEVTL LFFLTAIPSI NIYGYAITML 
IISSLSLCLN LYEIYKNINI GLSLSNFLIY ILTGVLTYIC LSPLSLKLSF IDFRIQVLAV 
TSIAASIFIF LIIKEKFSSR FRKISLKSR