Gene Ccel_1971 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ccel_1971
Symbol
ID	7310685
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium cellulolyticum H10
Kingdom	Bacteria
Replicon accession	NC_011898
Strand	-
Start bp	2331249
End bp	2333027
Gene Length	1779 bp
Protein Length	592 aa
Translation table	11
GC content	36%
IMG OID	643608905
Product	GerA spore germination protein
Protein accession	YP_002506299
Protein GI	220929390
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTAAAA AGAAAGGTTT TATAAAGACC CTGTTTTCTT ATATAACATA TAAAGAAAAA 
AAACCTGTAA AGCAGTTCTA TATTCCAGAA ATAGATAATG AAGTTACTTC TGAGAATAAA 
AACGGTCAAG AAAAAAATAC TTCGATGAAA CGGGATGGCT CAAAAAACAG AAAAATTAAA 
AGGCCTGTTC CTGTAGCAGA ATCAAGCAGG GAAAACAAGC CTCAATATGA AAAGGCTGAC 
GACGAAAAAA TATCAACAAA CATTGAAGAG AACATACAAT ATATCAAGCA TAAGTTTAAT 
TTCCCAAGTA ATAAGGATAT CATTATCCGG GAGTTGACCG TTGCAAAAAA ATACAAGGCA 
TTTATTGCAT ACATCGACGG TATGGTGGAC AGGATAACCA TTAATAATTT CATTTTAAGA 
GCATTAATGG TTAATGATGA TAAATTCCAA GAAGATTCTG ATGATGAATG CAAACTTGAC 
TTTATAATGT CCAATATATT GCAGACGAAC CAGGCCAAAA AGGTGGACAG TCCCGATGAA 
TTTTTGTACG AAATATTATC GGGTAATACC CTGTTATACG TTAATGGTTG TAACTTTTAT 
ATAACCAACG AAACAAAAGG TTATGACAAA AGGGGAGTAG ATAAGCCCCT TATAGAAGGC 
GTGGTTCTTG GATCACAGGA AGCATTCAAT GAAAATCTAA GAACAAATGT AACACTTATT 
AGAAAATTAA TAAAGAATAA TAACCTTACT ACTGAATTTA TCAAGGTTGG GAATGTAAAC 
AAGCAATTAT GTGCAATTAT GTCTATAAAA GGAATAACCA ACCCTGCAAT AGTAGAAGAA 
GTTAAAAGAA GAATAAAAAA CATAAAAAGT GATATGGTAC TTGGTGACGG AGTTCTGGAA 
CAATTTATAG AGGACAATCC ATATTCGATT TTCCCAACAA TATTGAGTAC CGAAAGACCT 
GACCGAGCCG CAGCACATAT CATGGAAGGA AAGGTTGCAA TACTTGCTGA AGGAGCACCC 
TTTGCTAAAA TTGTTCCTGT AACTCTTCTT ACTATTATGC ATAGCCCCGA AGATTCATAT 
ATGAGATGGC CATATGGTAC TTTAATAAGG TTAATCAGGT TTGTAGCAGC ATTTATTGCT 
ACATTACTAC CAGGCATCTA TGTTGCCATT ACCAATTTCC ATCAGGAAAT GATACCTACA 
GAGCTTTTAA TTGCGATAGC AAAGGCTAAA GAAAATGTAC CCTTCCCGAC AATAGTGGAA 
GTAGTATTAA TGGAATTGTC CTTCGAACTC ATAAGAGAGG CCGGAATAAG AATTCCGGGT 
ATAATAGGTA ACACACTGGG TATTATCGGT GCATTGATTC TCGGACAGGC GGCCGTTCAG 
GCCAACATTG TAAGTCCCGT TTTGATAATT GTTGTTTCAG TAACGGGACT TGGCAACTTT 
GCAATACCCA ATTACAGCAT GGCATTAGCA GCAAGAGTAT CTCGCTTTTG CTTTATTATT 
TTGGGAGCAT TACTTGGATT TTATGGAATA AGCATCGGAA TTGCTTTGTT TGCTATACTG 
ATTACTAATA TAAAGTCATT TGGAGTACCG TTTTTTGCCC CTATTGCCCC AAAAACTAAA 
GAAAGTAATG ACTTGTTCTT TAAAAAACCG GCATGGCAGC AGATATACAG GCCTGATTAT 
GTAAATGCTT TAAAACAGAA AAGACAAGCC AAGGTATCTA GACAATGGAC GGATGAAGAG 
CCAAAATACG GTTATGAAAG GGATGAAGAG GATGATTAA

Protein sequence

MSKKKGFIKT LFSYITYKEK KPVKQFYIPE IDNEVTSENK NGQEKNTSMK RDGSKNRKIK 
RPVPVAESSR ENKPQYEKAD DEKISTNIEE NIQYIKHKFN FPSNKDIIIR ELTVAKKYKA 
FIAYIDGMVD RITINNFILR ALMVNDDKFQ EDSDDECKLD FIMSNILQTN QAKKVDSPDE 
FLYEILSGNT LLYVNGCNFY ITNETKGYDK RGVDKPLIEG VVLGSQEAFN ENLRTNVTLI 
RKLIKNNNLT TEFIKVGNVN KQLCAIMSIK GITNPAIVEE VKRRIKNIKS DMVLGDGVLE 
QFIEDNPYSI FPTILSTERP DRAAAHIMEG KVAILAEGAP FAKIVPVTLL TIMHSPEDSY 
MRWPYGTLIR LIRFVAAFIA TLLPGIYVAI TNFHQEMIPT ELLIAIAKAK ENVPFPTIVE 
VVLMELSFEL IREAGIRIPG IIGNTLGIIG ALILGQAAVQ ANIVSPVLII VVSVTGLGNF 
AIPNYSMALA ARVSRFCFII LGALLGFYGI SIGIALFAIL ITNIKSFGVP FFAPIAPKTK 
ESNDLFFKKP AWQQIYRPDY VNALKQKRQA KVSRQWTDEE PKYGYERDEE DD