Gene CPF_0538 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPF_0538
Symbol
ID	4202883
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens ATCC 13124
Kingdom	Bacteria
Replicon accession	NC_008261
Strand	+
Start bp	639643
End bp	641196
Gene Length	1554 bp
Protein Length	517 aa
Translation table	11
GC content	29%
IMG OID	638081420
Product	glycine betaine/L-proline ABC transporter, permease/glycine betaine/L-proline-binding protein
Protein accession	YP_694992
Protein GI	110800299
COG category	[E] Amino acid transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1174] ABC-type proline/glycine betaine transport systems, permease component [COG1732] Periplasmic glycine betaine/choline-binding (lipo)protein of an ABC-type transport system (osmoprotectant binding protein)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.863672
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGAATAGTT TATTACAATA TGTAATTTCA CAGAAAACTC AAATATTAGA TTTATTAGTT 
CAACATATAT ATTTAACAAT TACGGCTATA GGAATAGCTA TATTAATAGG AGTTCCTTTA 
GGAATTCTTG TTTCAAGGGT TAAGTTTTTA AGAAAGCCTA TAATAGGATT TGTAAACTTA 
GTACAAGCTG TGCCTTCTAT GGCCTTACTA GGATTGCTTA TTCCCATATT AGGAATAGGA 
AGTACACCTG CAATCTTTAT GGTTGTAGTA TATTCATTGC TTCCAATAGT TAAAAATACT 
TACACAGGAA TCTCTGGCAT AGACCCAGTA GTATTAGAAT CTGCTAAGGG AATTGGACTT 
ACTAAGAACC AAAGTTTATT TAAGATACAA TTACCATTAG CATTGCCAAT AATAATGTCT 
GGTATAAGAA TATCAGCAGT TACAGCCGTA GGGCTTATGA CTTTAGCAGC CTTTATTGGT 
GCCGGTGGAC TTGGATACTT AGTATTCTCA GGAGTTCAAA CGGTAAATAA TAATATGATT 
TTAGCAGGAG CTATACCAGC TTGTATTTTA GCCTTAATAG TTGACTTTAT TTTCGGAAAA 
ATAGAGGTAG CTGTTACACC AAAGGGATTA AGTAATGATA ACAAAAAGAA AAATACTTTT 
GTTCTTAAAA TAATAAGTGT AATAATGATA ATAGCTATTT TATTTATGGG AATTTCATCA 
TTTATATCAA GTAAAAAAGA TAAAGTGGTT ATTGGATCAA AAAACTTTAC TGAGCAACTT 
ATTTTAGGAA ATATGTATGC AGATTTAGTT CAGGATAAAA CAGATTTACA AGTTGAAAAA 
AAGCTAAATC TAGGAGGAAC ATCAGTTGCC TTTGGAGCAC TTGAAAAAGG TGATGTTGAC 
ATGTATGTTG ATTATACTGG AACATTACTT GTTAATGTTA TGAAAGAAAA TAATATTGAT 
AATAGTGTAG ATTATTATAA TAGCATAAAA GAAAATATGA ACAAGGAACA TGGGTTAACA 
GTAATGGAAC CCCTAGGTTT TAATAATACT TATAATATAG CTATATCAAA AGAATTAGCT 
GATAAGTATA AGATAAATAC AATATCAGAT TTATCAAAGT ACAGTAATGA CTTTGTATTA 
TCTCCAACTA TTGAGTTCCA AAATAGACAA GATGGTTTAG TTGGATTAAA GAATTACTAT 
GGCATGGATT TCAAAAATGT TAAATCTTTA GATGGAAGTC TTAGATACTC AGCATTATCA 
AATGGGGAAT CACAGGCTAT AGATGCTTTC TCAACAGATG GACTTCTTAA AAAGTTTGAT 
TTAAAAACTT TAGAAGATGA TAAGAAATTC TTTGTAAATT ATAGTGCAGT ACCTATAGTT 
AACAATAAGA CTTTAGAAAA ATATCCACAA TTAAAGGATG TTTTAAACTC TTTAAGTGGT 
AAGATCAATG AAGAAAAAAT GATTGACTTA AACTATGAAG TAGATGTATT AGGTAAATCA 
CCAGAAGAGG TTGCTAAAGC TTTCTTAATT AGAGAAGGTT TAATAGAACA ATAG

Protein sequence

MNSLLQYVIS QKTQILDLLV QHIYLTITAI GIAILIGVPL GILVSRVKFL RKPIIGFVNL 
VQAVPSMALL GLLIPILGIG STPAIFMVVV YSLLPIVKNT YTGISGIDPV VLESAKGIGL 
TKNQSLFKIQ LPLALPIIMS GIRISAVTAV GLMTLAAFIG AGGLGYLVFS GVQTVNNNMI 
LAGAIPACIL ALIVDFIFGK IEVAVTPKGL SNDNKKKNTF VLKIISVIMI IAILFMGISS 
FISSKKDKVV IGSKNFTEQL ILGNMYADLV QDKTDLQVEK KLNLGGTSVA FGALEKGDVD 
MYVDYTGTLL VNVMKENNID NSVDYYNSIK ENMNKEHGLT VMEPLGFNNT YNIAISKELA 
DKYKINTISD LSKYSNDFVL SPTIEFQNRQ DGLVGLKNYY GMDFKNVKSL DGSLRYSALS 
NGESQAIDAF STDGLLKKFD LKTLEDDKKF FVNYSAVPIV NNKTLEKYPQ LKDVLNSLSG 
KINEEKMIDL NYEVDVLGKS PEEVAKAFLI REGLIEQ