Gene CPF_0103 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPF_0103
Symbol
ID	4202213
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens ATCC 13124
Kingdom	Bacteria
Replicon accession	NC_008261
Strand	-
Start bp	123542
End bp	124864
Gene Length	1323 bp
Protein Length	440 aa
Translation table	11
GC content	31%
IMG OID	638080984
Product	GTP-binding protein
Protein accession	YP_694567
Protein GI	110798691
COG category	[R] General function prediction only
COG ID	[COG1160] Predicted GTPases
TIGRFAM ID	[TIGR00231] small GTP-binding protein domain

Plasmid Coverage information

Num covering plasmid clones	3
Plasmid unclonability p-value	0.000228129
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTAATT TTAATGAAAC TCCTAGAGGA AGTAGAATTC ATATTTCTCT TTTTGGTAAA 
ACAAACTCTG GGAAATCTAG CATAATAAAT GCCCTAACAG GGCAAAACAT TTCTCTAGTA 
TCAGACTTTA AGGGAACAAC AACTGACCCT GTTTATAAGG CAATGGAACT TTTACCACTA 
GGACCTGTTG TTTTCGTTGA TACAGCTGGT TTTGATGATG AAGGAGAAAT AGGTAAGCTT 
AGAGTTGAAA AAACTGAAGA GGTTGTAGGA AAGACTGATG TAGCTCTTAT AACCCTTTCC 
CTTTCTGAAA TACTAGAGGC AATAAAATCA AATATAGAAT TTAAAGACAT GCTTTCTAAG 
GAAATATTAT GGCTTAATAA ATTAAAAAAG GCTAAGAAAC CAGCTATACT AGTTATTAAC 
AAGTGTGATT TAGTTCCTAA TAACCTAATT GAGTCTAAAA TTGATTTAAA GGATATTGAT 
AAAACAACTT TATCTAATAA AGATTGCTTT GTTGATAGTA ATTTAAATAA TTCTTTAAAA 
GAAATTGGTG AATTATTAGG AATACCTTGT GTTGCCATAA GTGCAAAAAA TAATTTAAAC 
ATAAATGAAT TAAAAAAAGA ACTTGTCAAT GTATCACCCT CTTCAATAAC TGAAAGCCCA 
ATAATAGGTG ATAAAATCAA AGCTGGAGAT AAAATTCTTT TAGTAGCTCC TCAAGATATA 
CAAGCTCCTA AAGGAAGACT TATACTTCCT CAAGTTCAAG TATTAAGAGA TATATTAGAT 
TATGGTGGAA TACCAACTAT GGTTACATTA GATAAATTAG ATGAAGGATT AAAAATCTTT 
AACGGTAAGC CTGACTTAGT AATAACTGAC TCTCAAGTAT TTAAACAAGT TAATGCAAAA 
TTAGATAGAA GTGTTCCTCT TACTTCCTTC TCAATACTTA TGGCTAGATA CAAGGGTGAT 
TTAGATAAGT TCTATTCAGG AGCCAAAGCA ATAAAGAATC TTAAAGCAGG TGATAAAGTT 
TTAATAGCAG AAGCTTGTAC TCACCATCAA TTAAAAGGTG ATATAGCAAG AGAAAAACTA 
CCTACTTGGT TAGAAGAAAC TTGTCCTGGA ATAATAGTTC ATAATTGCTC TGGTAAGGAC 
TTTCCTAAGA ATCTTAATGA ATATTCCCTT GTAATTCATT GTGGAGGATG CATGTTTAAC 
AAAGCTGAAA TAATGAATAG AATAGGAATA TGTGATTACG CCTTAGTTCC TATAACAAAC 
TTTGGTACAT CAATTGCAGA AATTAATAAT ATCTTAGACA GAGTAATGGA ACCCCTTAAG 
TAA

Protein sequence

MSNFNETPRG SRIHISLFGK TNSGKSSIIN ALTGQNISLV SDFKGTTTDP VYKAMELLPL 
GPVVFVDTAG FDDEGEIGKL RVEKTEEVVG KTDVALITLS LSEILEAIKS NIEFKDMLSK 
EILWLNKLKK AKKPAILVIN KCDLVPNNLI ESKIDLKDID KTTLSNKDCF VDSNLNNSLK 
EIGELLGIPC VAISAKNNLN INELKKELVN VSPSSITESP IIGDKIKAGD KILLVAPQDI 
QAPKGRLILP QVQVLRDILD YGGIPTMVTL DKLDEGLKIF NGKPDLVITD SQVFKQVNAK 
LDRSVPLTSF SILMARYKGD LDKFYSGAKA IKNLKAGDKV LIAEACTHHQ LKGDIAREKL 
PTWLEETCPG IIVHNCSGKD FPKNLNEYSL VIHCGGCMFN KAEIMNRIGI CDYALVPITN 
FGTSIAEINN ILDRVMEPLK