Gene Athe_1176 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Athe_1176
Symbol
ID	7408758
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerocellum thermophilum DSM 6725
Kingdom	Bacteria
Replicon accession	NC_012034
Strand	+
Start bp	1269010
End bp	1270878
Gene Length	1869 bp
Protein Length	622 aa
Translation table	11
GC content	39%
IMG OID	643715541
Product	hypothetical protein
Protein accession	YP_002573049
Protein GI	222529167
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.00138392
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATCAAGC TTCTAAACTT AAAGGTAAAA GATGAAGTGT ATGAAATTTT AAGCAGCTGC 
AAGGGAATAA TTATGCCAGA AAAGAGACTT GATTTTATAG ATTTATCCCT TGGTGGAAAA 
GATAATATGG TGTTTGAGGT AAAGTATGAG GTAGAAGGTA AGGGTGAAGT AGTTGAGGCG 
ATAGTTACAA GATGTAAAAA TGGTATTGTT GTAAATTATA CTGATGTGTA CATGAGAAGA 
AGAGACCCAG ATAGTTTAAT TATTGGTGAT GATGGGGAAA CTGACAAACA ACGATATAAA 
GACATTTATG GAGACAATTT TGAAAGAGTG AGGAAAGAAA CATTTGAATG GCTGAAAAAA 
CAAGAATTAG TAGTATATGG ATTTTATGCT GGAGGAAAGG AACACGGGTA TCCTGCTCTT 
GTAATAGCTC CGCTAAATGC CGCATTTTTT GGATTTGCAC TTGCTGATAT CCAGGGATTT 
ATTCCAAAAA GCGAATTTGA AAAGATTGAT GTTTTTGAAC CAAAAGCAGT GATATATGTA 
GCTCCACCTT TTAGACATAC ACATTTTAAC GGAAAACAAG TGGTTGTGCA CAATAGGTTA 
AATGGCGTCC ATGAAATATT TTCATATAAC TTGTACCCAG GACCAAGTGC TAAAAAGGGA 
GTATATGGTG TGCTTTTAAA CATCGGTGAA ATGGAAGGCT GGGTTGCTGC ACATGCTTCG 
ACAGTCAGGA TTGTTACACC ATATGACAAT GTGATAACAA TAATGCACGA GGGAGCAAGT 
GGTGGCGGAA AGAGCGAAAT GTGCCAGCAG ATGCATAGAG AAAAAGACAA TAGAGTCTTG 
CTTGGAGAAA ATATTATAAC AAAAGAAAGA ATTTACCTTG AAATAAAAGA ATCTTGCGAG 
ATACATCCAG TTACAGACGA TATAGCACTT GTTCATCCCA GCCTTCAAAA GGGTTCAAAA 
ATGGTTGTAA AAGACGCCGA ACAAGGTTGG TTTGTAAGAC TTGATAATAT TCCACATTAC 
GGTACAGACC CACAGCTTGA GAGGCTTTGC ATTCACCCAC CCGAGCCGTT AATATTCTTA 
AATTTAGAGG GTGTGCCTGG TTCAACCTGT CTTATATGGG AACACACAAT GGATGAGCCA 
GGAAAACCTT GCCCTAATCC AAGGGTTATT TTGCCTCGCA GGTTTATTCC GAACATTGTG 
GATGAACCTG TTGAGGTTGA CATACGAAGC TTTGGTGTGA GAACACCACC TTGCACTAAA 
CAAAAGCCGA CTTACGGTAT TATAGGGATG TTTCACCTTT TACCACCTGC ATTGGCATGG 
CTGTGGAGGC TTGTTAGCCC CCGCGGTCAT GCTAATCCAA GTATAACGCA GGCTGAGGCT 
TTGAGCTCTG AGGGTGTTGG TTCTTACTGG CCATTTGCAA CAGGACTTAT GGTAAAACAA 
GCAAACCTTT TGCTTGAACA GATTTTACAG TTTACAAAAA CTCAGTATAT TCTCATTCCA 
AACCAGCACA TAGGTGCATA CAAGGTTGGC TTTATGCCAC AGTGGATAAC AAGAGAATAC 
TTAGCAAAAA GAGGTAATGT TAAATTAAGA CCTGATCAGC TAAAACCTGC AAAGCTGCCG 
CTTTTGGGAT GGGCACTTGA ATACATGAAA GTTGAAGGAA CTTATATACC AAAGTTTTTA 
CTCCAGGTTG ATCTCCAGCA AGAGGTTGGA GAAGAAGCCT ATATGGAAGG AGCAAAGATT 
TTGACAGAAT TTTTCAAGAA AGAGATTATA AAATTCAAAA CATTGGATTT ACACCCACTT 
GGAAGAAGAA TTATAGAATG CTGCTTGGAT GATGGAAGCA TAGATGACTA TGTATCTTTG 
ATAAAATAG

Protein sequence

MIKLLNLKVK DEVYEILSSC KGIIMPEKRL DFIDLSLGGK DNMVFEVKYE VEGKGEVVEA 
IVTRCKNGIV VNYTDVYMRR RDPDSLIIGD DGETDKQRYK DIYGDNFERV RKETFEWLKK 
QELVVYGFYA GGKEHGYPAL VIAPLNAAFF GFALADIQGF IPKSEFEKID VFEPKAVIYV 
APPFRHTHFN GKQVVVHNRL NGVHEIFSYN LYPGPSAKKG VYGVLLNIGE MEGWVAAHAS 
TVRIVTPYDN VITIMHEGAS GGGKSEMCQQ MHREKDNRVL LGENIITKER IYLEIKESCE 
IHPVTDDIAL VHPSLQKGSK MVVKDAEQGW FVRLDNIPHY GTDPQLERLC IHPPEPLIFL 
NLEGVPGSTC LIWEHTMDEP GKPCPNPRVI LPRRFIPNIV DEPVEVDIRS FGVRTPPCTK 
QKPTYGIIGM FHLLPPALAW LWRLVSPRGH ANPSITQAEA LSSEGVGSYW PFATGLMVKQ 
ANLLLEQILQ FTKTQYILIP NQHIGAYKVG FMPQWITREY LAKRGNVKLR PDQLKPAKLP 
LLGWALEYMK VEGTYIPKFL LQVDLQQEVG EEAYMEGAKI LTEFFKKEII KFKTLDLHPL 
GRRIIECCLD DGSIDDYVSL IK