Gene Cphy_3586 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cphy_3586
Symbol
ID	5742611
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium phytofermentans ISDg
Kingdom	Bacteria
Replicon accession	NC_010001
Strand	-
Start bp	4428652
End bp	4430196
Gene Length	1545 bp
Protein Length	514 aa
Translation table	11
GC content	39%
IMG OID	641294698
Product	arabinogalactan endo-1,4-beta-galactosidase
Protein accession	YP_001560674
Protein GI	160881706
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG3867] Arabinogalactan endo-1,4-beta-galactosidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGGATAAAA AAATTAAAGT ATTATCCATA GTTCTTTGCT TCATTATGAT GTTAACTAGT 
TTTCAAATTA ATACGAAAGA AACGAAAGCG GCAACTAGTT TTGCTTATGG TGCTGATGTG 
GGTTGGTTAA GCCAGTTAGA AAAATCAGGT GTAACTTGGG TTGATGACTA TGGTTATACA 
AAGGATGCAC TACAGATACT AAAGGATCAT GGAATTGATT CGATTCGATT ACGCTTGTTT 
GTAAATCCTC CATCCAATTT CACTTGGACG AAAAAGGATG GATCAACATG TATGCTGGGG 
TATACTGATG CGGCTGGCTT AATATATATG GCAGAACGAT CAAAATCAAT GGGATTTCGA 
ATTATGGTTG ATTTTCATTA TAGTGATCAT TTTGCTGACC CTGCCTATCA GGACATACCA 
TCTGCTTGGT CATCACATAC CTTTACTCAG CTGAAAAAAG ATGTTTATGA TCATACTTAT 
TCTGTTATGT CTCAGCTAGC TACAAAGGGA ATCTATCCGG AGTGGGTTCA GGTTGGGAAC 
GAGATTAACA GCGGTATGTT ATTACCTTAT GGACAGAGCA GTAATAACTT TAGCCAGCTG 
ACAGAGTTAC TGAATAGTGG ATATGATGCG GTAAAAGCGG TAAGCAAATC GACTAAAGTT 
GTAACTCATC TTGCAGATGG TAATAACAAT ACAACGTTTC GATGGTTCTT TGATAATTTT 
ATTACTAAAT ATGGTGGAAA AACAGATGTA ATTGGTATGT CCTACTATCC GTATTGGATA 
GGAAGTGACT ATACACAGTC GATTTCTTAC TTGGCAAATA ACCTTAATGA TATGGCATCT 
CGCTATAATA AAGAGGTTAT GGTATGCGAA GTGGGAGGGG TTGAAACAGA TTCAGCCAAT 
ACCTATAACT TGTTAAAAGC AACCATTGAG AAGGTGAAGG CTGTTCCGAA CGGAAAAGGT 
TTAGGTGTAT TTTACTGGGA ACCAGAGGCT AATTCCTCGG TACTTCCGGA TCGTTATAAG 
CTTGGAGCAA CCAGCGTTGT TTCTGGGAAA AAATTAAGGT TCACCACAGC TATTGATGCT 
TTTTATGATT GTCGCTATAA TAGCTCATCT TTTGATACCA GCAAAACATA TATACTAACC 
AATCGACTTA GTGGGAAAGC AATTAATGTA AGAGGTGGCT CAACAAGCGA TAATGCTGTC 
CTTGAGCAAT ATAGTTATGG GGCATGGAGT AGTCAAAAAT GGACTTTCTC GCTAAATAGT 
AGCGGTTATT ATACCATAAA AAGTGTATTA AGCAGTAAGG TAATGGATGT ATCAGGAGCT 
TCCACCAGTG AAGGAGCTAG TGTAATACAG TATACCTCTA ATAATGGTAA TAACCAACAA 
TGGAGTTTGG GTTCCACAGG AGATGGGTAT TATAAGCTGA TCAATCGAGG AAGCGGTAAA 
CTCTTAGCTG TACAGAATGC TTCAACAGAG GAAGGCGTGG CCTTGGTGCA ACAAACAGAC 
ACCAATGCGT TAAGCCAGAT GTGGAGACTT GAAATTGTAA ACTAA

Protein sequence

MDKKIKVLSI VLCFIMMLTS FQINTKETKA ATSFAYGADV GWLSQLEKSG VTWVDDYGYT 
KDALQILKDH GIDSIRLRLF VNPPSNFTWT KKDGSTCMLG YTDAAGLIYM AERSKSMGFR 
IMVDFHYSDH FADPAYQDIP SAWSSHTFTQ LKKDVYDHTY SVMSQLATKG IYPEWVQVGN 
EINSGMLLPY GQSSNNFSQL TELLNSGYDA VKAVSKSTKV VTHLADGNNN TTFRWFFDNF 
ITKYGGKTDV IGMSYYPYWI GSDYTQSISY LANNLNDMAS RYNKEVMVCE VGGVETDSAN 
TYNLLKATIE KVKAVPNGKG LGVFYWEPEA NSSVLPDRYK LGATSVVSGK KLRFTTAIDA 
FYDCRYNSSS FDTSKTYILT NRLSGKAINV RGGSTSDNAV LEQYSYGAWS SQKWTFSLNS 
SGYYTIKSVL SSKVMDVSGA STSEGASVIQ YTSNNGNNQQ WSLGSTGDGY YKLINRGSGK 
LLAVQNASTE EGVALVQQTD TNALSQMWRL EIVN