Gene Acel_0444 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acel_0444
Symbol
ID	4485194
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Acidothermus cellulolyticus 11B
Kingdom	Bacteria
Replicon accession	NC_008578
Strand	+
Start bp	476740
End bp	477915
Gene Length	1176 bp
Protein Length	391 aa
Translation table	11
GC content	62%
IMG OID	639729211
Product	UDP-sulfoquinovose synthase
Protein accession	YP_872204
Protein GI	117927653
COG category	[G] Carbohydrate transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0451] Nucleoside-diphosphate-sugar epimerases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.52178
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	0.455696
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGTGTCC TGATTCTCGG CGGTGACGGT TTCTGCGGTT GGCCGACCTC CCTGCACCTG 
TCGGCACAAG GGCATGACGT GCACATTGTC GACAACTTCG CCCGGCGGTG CGCGGACATC 
GAATTGGAAG CCGAATCGCT CACCCCGATC GCGCCGATGG GAACCCGGTT GCGCGCCTGG 
CGTGAGGTGA GCGGCAAGGA GATCGAATTC TCCCGGTTCG ACGTCGCGGT GCACTATCAC 
CGGCTGCTCA CCCTGCTGCA GGAGTGGCAG CCGGACGCGG TTGTGCACTT CGCCGAACAG 
CGGGCCGCGC CGTACTCGAT GAAATCGTCG TGGCACAAGC GGTACACGGT GAACAACAAC 
ATCAACGCGA CGAACAACCT GCTCGCCGCC ATCGTCGAAT CCGGGCTGGA CATTCACGTC 
GTCCACCTCG GAACGATGGG CGTGTACGGC TACGGCACCG CCGGGATCAA AATTCCCGAA 
GGATACCTGC GGGTGCAGAT TCCCAAGGAG AACGGCGAAG TCGTTGAATC GGAAATCCTC 
TACCCGCCGA ACCCGGGGTC GATTTATCAC ATGACGAAGA CGCAGGACCA GCTGCTCTTC 
GCCTACTACA ACAAGAACGA CGGGGTGCGG GTCACCGACC TGCACCAGGG CATCGTCTGG 
GGCACCCAGA CTGTCGAGAC CCGGCTCGAC GACCGGCTCA TCAACCGATT CGATTACGAC 
GGCGATTACG GAACTGTGCT GAACCGGTTC CTCGTCGAAG CCGCGATCGG ATATCCGCTG 
ACCGTGCACG GATCGGGCGG CCAGACCCGC GCGTTCATCA ACATTCAAGA CACCGTGCGG 
TGCATTCAGC TTGCGGTCGA GAATCCGCCC AACCCCGGGG AGCGGGTGCG GGTCTTCAAC 
CAGATGACCG AGTGTCACCG GATCATCGAC TTGGCCAAGC TGGTCTCCGA GCTCACCGGC 
GTGGAGATCG ATCACGTGGA GAATCCGCGG AACGAAGCGG ACTCCAACGA CCTGTTCGCC 
GAGAACCGGC AGCTCCTCGA ACTCGGGTTG AAGCCGATCA CCCTGGAGGC CGGGCTGCTC 
ACCGAAATCA CCGAGATCGC GCGGAAGTAC GCCGACCGGA TCGACGTCGA CAAGATCCCG 
TGCCGGTCGT ACTGGCGTCC GAAGCGGAGT GTGTGA

Protein sequence

MRVLILGGDG FCGWPTSLHL SAQGHDVHIV DNFARRCADI ELEAESLTPI APMGTRLRAW 
REVSGKEIEF SRFDVAVHYH RLLTLLQEWQ PDAVVHFAEQ RAAPYSMKSS WHKRYTVNNN 
INATNNLLAA IVESGLDIHV VHLGTMGVYG YGTAGIKIPE GYLRVQIPKE NGEVVESEIL 
YPPNPGSIYH MTKTQDQLLF AYYNKNDGVR VTDLHQGIVW GTQTVETRLD DRLINRFDYD 
GDYGTVLNRF LVEAAIGYPL TVHGSGGQTR AFINIQDTVR CIQLAVENPP NPGERVRVFN 
QMTECHRIID LAKLVSELTG VEIDHVENPR NEADSNDLFA ENRQLLELGL KPITLEAGLL 
TEITEIARKY ADRIDVDKIP CRSYWRPKRS V