Gene Athe_1781 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Athe_1781
Symbol
ID	7408568
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerocellum thermophilum DSM 6725
Kingdom	Bacteria
Replicon accession	NC_012034
Strand	-
Start bp	1854408
End bp	1855919
Gene Length	1512 bp
Protein Length	503 aa
Translation table	11
GC content	36%
IMG OID	643716158
Product	ABC transporter related
Protein accession	YP_002573647
Protein GI	222529765
COG category	[R] General function prediction only
COG ID	[COG3845] ABC-type uncharacterized transport systems, ATPase components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	1
Plasmid unclonability p-value	0.000000368661
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAGTACA TTTTGCAGGT AAAGGATATT TCTAAAAGAT TTGGTAATAT TCAAGCAAAT 
GATAATGTGT TTTTGGATGT CAAAAAAGGT GAGGTACATG CCATACTTGG GGAAAATGGT 
GCTGGAAAGT CTACTTTAAT GAATATCATC TATGGTCTTT ATACTCCTGA TTCTGGAGAG 
ATATATTTTG AAGGTCAAAA ACTTGAAGTC AAAGGACCTC ATGAAGCAAT TGAAAAAGGA 
ATAGGAATGG TTCATCAGCA TTTTATGTTG ATACCTGTAT TTACCGTGGC TGAAAATATT 
GTTTTGGGAT TTGAGCCAAA AGGTTTTAGG TTTAATGTTC AAGAAGCTGA GAAGAAAATT 
CTTGAGATTT CGAAGAAATA CAATTTAGAA ATTGACCCAA AGGCAAAAGT TGGAGATTTA 
AGTGTAGGTA TGCAACAAAG AGTAGAGATA TTAAAGGCTT TTTACAGAGA TGCAAGGCTT 
TTGATACTTG ATGAACCAAC AGCAATGCTA ACACCCCAAG AGACAAGGGA ACTTTTTAAG 
ATTATAAATA ACCTGAAAGC TCAAGGGATA TCCATATTAT TTATAAGCCA CAAACTTGAT 
GAGGTTATGG AAATTTCAGA TAGAGTAACT GTTATGAGAA GAGGAAAGAC AATAAAGACC 
TTGAACACCA AAGAAACAAC CGAACAGGAA CTTGCAAATT TGATGGTCGG AAGAGAAGTT 
AAACTTGTTG TTGAAAAGAC TGAACCGCGG TTAGGAGAGA CTGTGTTAAA GGTTGAAAAC 
CTTTCAGTCA AACTGAAAAA CGGTGTTGAA AAGGTCAAAG ATGTAAGTTT TGAAGTAAGA 
AGAGGAGAGA TTTTTGGTAT AGCAGGTGTT GATGGAAATG GACAAAATGA GCTTGTAGAA 
GCTATTGTTG GACTTATTTC ATCAACAGGG AAAATAATCT TCAAAGGAGA GGAAATTCAA 
AACCTTCCCA CCCGCAGACG TTACGAAAAA GGGATTGCTT ATATTCCAGC AGACAGGCAG 
CAGGACGGGC TTGTTTTGAA CTTTACAGTG GCAGAAAACA TTGTGCTCAA AAGGTACTAT 
AAAAAGCCAT ATTCTAATGG AGGTTTTTTA AATTATAAGG TAATAATCTC AGAAGCTGAT 
AGACTCATAC ATGAATTTGA TGTGCGTCCA CCTGATTACA AGTTATTTGC AAAGAATCTT 
TCAGGTGGCA ATCAGCAAAA GGTAATCTTG GCAAGAGAGT TTTCAAGCAG TCCAGACCTT 
TTAATTGCTG TTCAACCAAC AAGAGGAATG GATGTGGGAG CTATAGAGTA CATCCATAGA 
AAACTGATTG AACTTCGGGA CAGTGGTAAA GCAATACTAC TTGTTTCTTT AGAACTTGAT 
GAGATTTTGA ATCTTTCTGA CAGGATTGCT GTGATGTATT CGGGCAGGAT TATGGATATT 
TTGGAAAGTA AAAATGCAAC AAAAGAAGAG ATAGGACTTA TGATGATAGG CAAGAAAAAG 
AAGGAGGCCT AA

Protein sequence

MEYILQVKDI SKRFGNIQAN DNVFLDVKKG EVHAILGENG AGKSTLMNII YGLYTPDSGE 
IYFEGQKLEV KGPHEAIEKG IGMVHQHFML IPVFTVAENI VLGFEPKGFR FNVQEAEKKI 
LEISKKYNLE IDPKAKVGDL SVGMQQRVEI LKAFYRDARL LILDEPTAML TPQETRELFK 
IINNLKAQGI SILFISHKLD EVMEISDRVT VMRRGKTIKT LNTKETTEQE LANLMVGREV 
KLVVEKTEPR LGETVLKVEN LSVKLKNGVE KVKDVSFEVR RGEIFGIAGV DGNGQNELVE 
AIVGLISSTG KIIFKGEEIQ NLPTRRRYEK GIAYIPADRQ QDGLVLNFTV AENIVLKRYY 
KKPYSNGGFL NYKVIISEAD RLIHEFDVRP PDYKLFAKNL SGGNQQKVIL AREFSSSPDL 
LIAVQPTRGM DVGAIEYIHR KLIELRDSGK AILLVSLELD EILNLSDRIA VMYSGRIMDI 
LESKNATKEE IGLMMIGKKK KEA