Gene Ccel_3103 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ccel_3103
Symbol
ID	7311700
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium cellulolyticum H10
Kingdom	Bacteria
Replicon accession	NC_011898
Strand	-
Start bp	3639025
End bp	3640215
Gene Length	1191 bp
Protein Length	396 aa
Translation table	11
GC content	41%
IMG OID	643610007
Product	small GTP-binding protein
Protein accession	YP_002507375
Protein GI	220930466
COG category	[R] General function prediction only
COG ID	[COG1160] Predicted GTPases
TIGRFAM ID	[TIGR00231] small GTP-binding protein domain

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTCTCA CAAATACACC GGGTGCAAAC AGGCTGCACA TTGCACTATT CGGCAGAAGA 
AACAGCGGAA AATCTTCACT AATTAATACA ATAACAGGAC AGGACATTGC TCTGGTATCG 
GAAATTGCCG GAACCACTAC AGATCCCGTA TACAAGGCTA TGGAACTGCA CCCTATAGGC 
CCTGTTATGT TTATTGATAC GGCAGGCTTT GATGATGTGG GCACTTTAGG CGAACTAAGA 
ATAGAGAAAA CACGAAAGGT AATTGATAAA ACGGATATAG CCATTGTAAT TTTCTCTGAA 
ACCGAGCTTT CGATGGAAAA GGAATGGATG AATGAGCTAA AAAAACGTAA AATACCCGTT 
ATTCCCATAA TAAATAAAGC GGATATACTT AATAATACAG ATGATATAAA AAAGCAGGTG 
GAGGAAACTC TGGGCCTGAT GCCAATCATT ATCAGTGCAA AGGAAAAAAC AGGGCTTGAT 
AAAGTCAGAG AAGAGCTAAT TAGAGCGGTG CCGGAGGATT TTGAGGTAAG CAGCATAACC 
GCCCATCTTG TAAATGAAGG AGATTTTGTT TTGTTGGTCA TGCCTCAGGA CATTCAAGCT 
CCAAAGGGAC GCCTGATTCT GCCTCAGGTG CAGGTAATCA GAGATTTACT GGATTTAAAA 
TGTATTGTTA TGAGTGTTAC TACCGACAAG CTTGAAAATG CACTAAAGGC AATGTCAGGA 
CCTCCCAAAT TAATAATTAC CGATTCACAG GTGTTCGACA AAGTATATGC TAAAAAACCT 
GAAGAAAGCC TGTTGACATC ATTTTCCGTT CTGTTTGCAG AATATAAAGG TGATATTTCT 
GCATACATTA AAGGTGCTGA AGCAATAGAT GCACTAACTG AGAATTCAGC CGTTCTGATA 
GCGGAAGCCT GTACCCATGC ACCTCTAAGT GAGGATATCG GACGTGTGCA GCTGCCAAGG 
CTTCTCAGGG AAAAGATAGG AAAAGGTCTA ACTGTTGACA TTGTAAGCGG GAGCGACTTT 
CCAAAAGATT TGTCAAAATA TTCACTGGTC ATTCAGTGTG GCTGCTGCAT GTTTAACAGG 
AAATATGTAC TCTCACGTAT AGAGTCTGCT AAGGCACAGA ATGTAAGAAT TTGTAATTAC 
GGAATTGCAA TCGCGAAGCT AAGAGGCATA CTAGAAAAAG TTGCATTATA G

Protein sequence

MSLTNTPGAN RLHIALFGRR NSGKSSLINT ITGQDIALVS EIAGTTTDPV YKAMELHPIG 
PVMFIDTAGF DDVGTLGELR IEKTRKVIDK TDIAIVIFSE TELSMEKEWM NELKKRKIPV 
IPIINKADIL NNTDDIKKQV EETLGLMPII ISAKEKTGLD KVREELIRAV PEDFEVSSIT 
AHLVNEGDFV LLVMPQDIQA PKGRLILPQV QVIRDLLDLK CIVMSVTTDK LENALKAMSG 
PPKLIITDSQ VFDKVYAKKP EESLLTSFSV LFAEYKGDIS AYIKGAEAID ALTENSAVLI 
AEACTHAPLS EDIGRVQLPR LLREKIGKGL TVDIVSGSDF PKDLSKYSLV IQCGCCMFNR 
KYVLSRIESA KAQNVRICNY GIAIAKLRGI LEKVAL