Gene Athe_1330 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Athe_1330
Symbol
ID	7408911
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerocellum thermophilum DSM 6725
Kingdom	Bacteria
Replicon accession	NC_012034
Strand	+
Start bp	1415196
End bp	1416251
Gene Length	1056 bp
Protein Length	351 aa
Translation table	11
GC content	30%
IMG OID	643715695
Product	protein of unknown function UPF0118
Protein accession	YP_002573203
Protein GI	222529321
COG category	[R] General function prediction only
COG ID	[COG0628] Predicted permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGCACATAA TAAAATTGGT CAAAAGATAT TTTACAGATA TATTGTTCAT AGCTCTAATT 
GCAATTGTTA TCTATTTTTT TACTAATATG AAGGCATTTT GGCCGATTCT GATTCCATTT 
TTGATTGCAC TATTTTTGTC ATATCTCTTA AAACCTTGCG TAGATTTTTT AGAAACAAAG 
ATTCGGTCAA GAGATATCTC AATCCTGATT TCGTTTGCAA TAATCTTTGG TATCACCATT 
ATGGTATTTG TATATTTTAT TCCTTTATTT GTTAGCGAAA CTAAGCAGCT TATCCAAAAC 
ATTCCTGATT ATATAATACT AATTCAAAAA TGGTTTTTTG AGATTGATTC TAAACTTTTG 
AATAAACTAA ACATTGATAT TAAAGAAATA CTAAACGCTA ATTCAATCAA TATCGAAGGA 
ATTTCCAAAC AAACATTATC AATATTTTTA AACATTGTAA AGAGTATTTC CTCTAACATT 
TTGTATTATC TTCTTATTCC TATTATATCT TTTTATATCC TGAGGGATTG GAAAAGGTTA 
GTCATGTGGA TAAAATGGTT ATTACCCGAG AAATACAGAA AAGAAGGACT TTATATCTTT 
GTTGATATAA ATAGGGTTCT TCATCAGTAT ATTCGAGGGC AGCTTCTTGA TGCCTTTATA 
GTTGGACTGC TCAGCTTTGT AGGATTTTCT CTGCTTTCTG TAAGATATGC AGCTCTTTTG 
GGTGTAATAA CTGGTATTGG CAATTTGATT CCCTATTTTG GACCAATATT TAGCAGTATT 
CCAGCAGTGA TAATAGCACT TTCTGACTCT TACATAAAGG CTATATTGGT TGTGATTTTT 
TTAGTCCTAC TTCAGCAAGT TGACAGTTTT ATCATATCCC CACGAGTTAT TGGTTCAAAA 
GTCGGGCTTC ATCCTCTTAC CATAATTATA GTTATAATCT TAGCAAACAA AATATTTGGG 
TTTATTGCAA TGTTCTTTGC TATTCCTATT GCTGCAGTAA TAAAAATTAT ATTTATTAAT 
ATCATGAAAA GGATAAAATC TGAGAAGATT GAGTGA

Protein sequence

MHIIKLVKRY FTDILFIALI AIVIYFFTNM KAFWPILIPF LIALFLSYLL KPCVDFLETK 
IRSRDISILI SFAIIFGITI MVFVYFIPLF VSETKQLIQN IPDYIILIQK WFFEIDSKLL 
NKLNIDIKEI LNANSINIEG ISKQTLSIFL NIVKSISSNI LYYLLIPIIS FYILRDWKRL 
VMWIKWLLPE KYRKEGLYIF VDINRVLHQY IRGQLLDAFI VGLLSFVGFS LLSVRYAALL 
GVITGIGNLI PYFGPIFSSI PAVIIALSDS YIKAILVVIF LVLLQQVDSF IISPRVIGSK 
VGLHPLTIII VIILANKIFG FIAMFFAIPI AAVIKIIFIN IMKRIKSEKI E