Gene Acel_1842 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acel_1842
Symbol
ID	4485449
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Acidothermus cellulolyticus 11B
Kingdom	Bacteria
Replicon accession	NC_008578
Strand	-
Start bp	2083315
End bp	2084184
Gene Length	870 bp
Protein Length	289 aa
Translation table	11
GC content	65%
IMG OID	639730632
Product	hypothetical protein
Protein accession	YP_873600
Protein GI	117929049
COG category	[R] General function prediction only
COG ID	[COG1611] Predicted Rossmann fold nucleotide-binding protein
TIGRFAM ID	[TIGR00725] conserved hypothetical protein, DprA/Smf-related, family 1 [TIGR00730] conserved hypothetical protein, DprA/Smf-related, family 2

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.0573823
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	0.171511
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCAACG ACCGGGCGAA GGTGCCGCCG CGGGATGAGT CATCCACCGA TGCGCGGCAG 
AACGCCGCTG CGCGCCGGCA GGCGGACCCG GCATCCACCG GCAACCACGG CAACCACACC 
AACCACCACG TCGTCGAGAA GCGGCGCGGG CCGGTCCTGC TCCGCCGTTC CCAGGTCTCC 
ACCACGACGA CGGATCAGCG GTTGCTCGAC AGCCGTGGCC CGTCCGACTG GGTGCACACC 
GATCCGTGGC GCGTGCTGCG GATCACCTCG GAATTCGTGG AAGGGTTCGG GCTGCTTGCC 
GAGCTCGGCG CCGCCGTCTC GGTCTTTGGT TCCGCGCGGA CCACGCCGGA TCACCCGGAT 
TACGCGGCCG CGGAGAAACT CGGCGCCGCG CTGGCCCGCG CCGGGTACGC CGTCATCACC 
GGCGGTGGTC CGGGCGTCAT GGAGGCGGTG AACAAGGGAT GCAGCGAGGC CGGCGGAGTC 
TCCGTTGGAC TGGGCATCGA GCTCCCCTTC GAGCAACGCC TCAACGATTG GGTGGACATC 
GGCATTCAAT TTCGGTACTT CTTCGCCCGC AAGACCATGT TCGTGAAGTA CGCCCAAGGC 
TTTGTCGTTT TCCCCGGCGG TTTCGGCACG CTGGATGAGC TCTTCGAAGC GCTGACCTTG 
GTGCAGACAC GCAAGGTCAC CTCGTTTCCC GTCGTCTTGT ACCGCGAAGA GTACTGGCAT 
GACCTCATCG AATGGACCCG CCGGCGCATG CTGGACGAAG GAAAGATTTC ACCGGAAGAT 
CTCGATTTGT TCTCCGTAAC CGATGACGTC GATGAGATCG TGGAGATTAT GGAGCGTGCG 
GAAGCGGCGC GCTACGGAGC GGCATCCTGA

Protein sequence

MSNDRAKVPP RDESSTDARQ NAAARRQADP ASTGNHGNHT NHHVVEKRRG PVLLRRSQVS 
TTTTDQRLLD SRGPSDWVHT DPWRVLRITS EFVEGFGLLA ELGAAVSVFG SARTTPDHPD 
YAAAEKLGAA LARAGYAVIT GGGPGVMEAV NKGCSEAGGV SVGLGIELPF EQRLNDWVDI 
GIQFRYFFAR KTMFVKYAQG FVVFPGGFGT LDELFEALTL VQTRKVTSFP VVLYREEYWH 
DLIEWTRRRM LDEGKISPED LDLFSVTDDV DEIVEIMERA EAARYGAAS