Gene Ccel_3334 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ccel_3334
Symbol
ID	7312477
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium cellulolyticum H10
Kingdom	Bacteria
Replicon accession	NC_011898
Strand	-
Start bp	3878597
End bp	3879727
Gene Length	1131 bp
Protein Length	376 aa
Translation table	11
GC content	36%
IMG OID	643610237
Product	glycine betaine/L-proline ABC transporter, ATPase subunit
Protein accession	YP_002507603
Protein GI	220930694
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1125] ABC-type proline/glycine betaine transport systems, ATPase components
TIGRFAM ID	[TIGR01186] glycine betaine/L-proline transport ATP binding subunit

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.0347475
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGATTAAAT TTGAAAATAT ATTCAAAAAA TACAAAGATA CAACTGTGTT GAAAAACATT 
TCGCTGGAAG TTGAAAAAGG GCAATTGGTT TCACTTATCG GAGAAAGTGG CTGCGGTAAG 
ACAACTACAT TAAAAATGAT TAATCGCCTG ATAAAGCCTT CGTCCGGCAA AATATTTATT 
AATGGTAAGG ACATAGAAAA AAGAGATATT ATAAAGCTTA GAAGAAATAT GGGGTATGTA 
ATTCAGCAGA CAGGGTTATT TCCACATATG ACAATAAAGG AAAATATTGA GCTAATCCCA 
AAGGTCCAGA AAAAGGATTC TGAAGAAATA AGAAAAAAAA CTTATGAATT ATTGGAAATG 
GTTGGGCTGG AAGCTGACGA GTTTCTTGAT AGGTACCCTT CTGAGATAAG TGGTGGGCAA 
CAGCAGAGAG TTGGGGTAGC AAGAGCATTT GCAACTGACC CGGAGATTAT CCTGATGGAT 
GAGCCGTTTT CAGCACTTGA TCCAATTACC AGGATAAGCC TGCAGGATGA GCTTATAAAT 
ATACAGGCAA TTTATAAAAA GACAATAGTC TTTGTTACAC ATGACATGGA TGAGGCAATA 
AAGATATCGG ATAAGATATG TATAATGAAA GATGGAGAAA TTCTTCAGTA TGATACACCT 
GAAAATATAT TGAAAAATCC TCAGAATGAA TTTGTATCAG AGTTTGTAGG TAGAAATAGA 
ATCTGGACTT CCCCCGAATT TATAAAGGCA AAGGATATTA TGATTGATAC CCCGGTAACC 
TGTCAGAGCA GTACGACGCT TCTTGGGTGT ATTGAAAGAA TGCGTGTGGA AAAGGTAGAT 
AGCCTTATGG TAGTTGAAGA AAAAACAAAA AGACTGTTAG GTATAGTGAA TGCAAAGCAA 
ATACAAAACC AGAGAGACCG TACAATAAAA GTTGGCGATA TTATGACCAC TAACTTCCTG 
AGTGTACTTG AGGACGACTC AATTATAGAT ATTTTAAAAA TTGTAGACGA AAAGCATGTA 
TCAGCAATTC CTGTTTTGAA CGAAAGTGAC AGACTTTTAG GCTTGATAAC AAAGAGCAGT 
CTTGTTACTA CTCTAAGCCA GCAATATCTT GATTTGGAAA ATCTGGAGTA A

Protein sequence

MIKFENIFKK YKDTTVLKNI SLEVEKGQLV SLIGESGCGK TTTLKMINRL IKPSSGKIFI 
NGKDIEKRDI IKLRRNMGYV IQQTGLFPHM TIKENIELIP KVQKKDSEEI RKKTYELLEM 
VGLEADEFLD RYPSEISGGQ QQRVGVARAF ATDPEIILMD EPFSALDPIT RISLQDELIN 
IQAIYKKTIV FVTHDMDEAI KISDKICIMK DGEILQYDTP ENILKNPQNE FVSEFVGRNR 
IWTSPEFIKA KDIMIDTPVT CQSSTTLLGC IERMRVEKVD SLMVVEEKTK RLLGIVNAKQ 
IQNQRDRTIK VGDIMTTNFL SVLEDDSIID ILKIVDEKHV SAIPVLNESD RLLGLITKSS 
LVTTLSQQYL DLENLE