Gene Cthe_2636 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cthe_2636
Symbol
ID	4808947
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium thermocellum ATCC 27405
Kingdom	Bacteria
Replicon accession	NC_009012
Strand	-
Start bp	3117237
End bp	3118775
Gene Length	1539 bp
Protein Length	512 aa
Translation table	11
GC content	37%
IMG OID	640108049
Product	integral membrane protein MviN
Protein accession	YP_001039028
Protein GI	125975118
COG category	[R] General function prediction only
COG ID	[COG0728] Uncharacterized membrane protein, putative virulence factor
TIGRFAM ID	[TIGR01695] integral membrane protein MviN

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGAAAA AAATTGCCAT AGTATTAGCC ATTATAACGA TCATATCAAA ATTCTTCGGT 
TTCTTCAGGG AGATTATCCT GTCGTACTTT TATGGTGTAA GCAATGAAAG CGATGCCTAT 
ATAATAGCCC TTACAATACC AACTGTCATT TTCGCATTTG TGGGCACCGG GCTTGCCACG 
ACATTTATTC CCATATACAA CAGCATATTG GCACAAAAAG GTGAAAAGGC CGCAAATGCT 
TTTACCAATA AAGTCATAAA CATAATATTT GTTATTTCCT CCGTAATAGT CCTTTTAATA 
TTTGTCTTTA CAGAGCATAC AGTCAAATTG TTTGCATACG GTTTCGACAA AGAAACTATG 
GAGTTGGCAG TCCAATTTAC CAGAATAATT TCCCTGGGGA TTTATTTTAT CGGGCTTGGC 
TATGTTTTTA AAAGTCTGCT TCAAATAAAA GATAATTTTA TCGTCCCGGC AATAGTGGGA 
TTCCCATATA ATTTCATAGT CATAATATCC ATCATTGCAA GTACAAAGTG GAATATTATG 
ATTTTGCCTC TGGGCACTTT TATTGCCACA TCTCTGGAAA CCATTGTTTT GTTTCCAGGC 
ATAATAAAGT CGGGATACAA ATACCTGCTC GACTTTAAAA TTGACAACCA CATAAAAAAG 
ATGTTTTTTC TGTCAATACC GGTTATACTG GGAACATCTG TAAACCAAAT CAACAAACTT 
GTTGACAGAA CTTTGGCCTC CCAGATTTCC GTGGGAGGAA TTTCTGCATT AAATTACGCG 
TCAAGACTGA ACAATTTTGT CCAGGGAGTC TTTGTGGTTT CAGTGATTGC GGTAATGTAT 
CCCGCAATAT CCAAACTGGC AGCTGAAAAT AATATGAAAG AACTTAAAAA AGTATTGTCG 
GAATCAATTA TCGGAGTAAC ATTGCTATTA GTGCCGCTGT CTGTAGGTGC CATGATTTTT 
TCAAAAGAAA TAGTTGCATT GTTGTTTGGC AGGGGAGCAT TTGACAAAAC CGCGGTAGAT 
ATGACTTCCG TATCCCTGTT CTATTATTCC ATAGGTATGC TGGCATTTGG AATCAGGGAT 
GTTCTTTCAA GAGTGTTTTA CTCTGTCAAA GACACTAAAA CCCCAACAAT TAACGCAGGT 
ATCGGCATGG CGCTCAATAT TGTTTTGAAT ATAATTTTGT CCCGATACAT GGGAATCGGG 
GGTCTGGCAC TGGCAACCAG CATAGTAGGC ATATTCATCA CAATATTGAT GTTTGTAACG 
CTGAGAAAAA AAATAGGCCC CTTGGGAATG AAAGCAATGA GTTTTAAATT CTTCAAGATT 
TTGGTATCTT CATTGCTTAT GGGAGTAATA GCCCACATAT CTTACAGATA TCTTGAAAAT 
TTCGCAGGTT CCAATATTTC AATCATAATA TCAATCACAG GCGGTGCATT GATATACTTT 
GTGATTATCT ATTTTATGAA AATCGAGGAT GTGGAAGTTT TGGTAAAACA GTTTAAGCGC 
AAATTATTCG GCAGAAAAAA ACAGCTCAAT AACGGTTAA

Protein sequence

MKKKIAIVLA IITIISKFFG FFREIILSYF YGVSNESDAY IIALTIPTVI FAFVGTGLAT 
TFIPIYNSIL AQKGEKAANA FTNKVINIIF VISSVIVLLI FVFTEHTVKL FAYGFDKETM 
ELAVQFTRII SLGIYFIGLG YVFKSLLQIK DNFIVPAIVG FPYNFIVIIS IIASTKWNIM 
ILPLGTFIAT SLETIVLFPG IIKSGYKYLL DFKIDNHIKK MFFLSIPVIL GTSVNQINKL 
VDRTLASQIS VGGISALNYA SRLNNFVQGV FVVSVIAVMY PAISKLAAEN NMKELKKVLS 
ESIIGVTLLL VPLSVGAMIF SKEIVALLFG RGAFDKTAVD MTSVSLFYYS IGMLAFGIRD 
VLSRVFYSVK DTKTPTINAG IGMALNIVLN IILSRYMGIG GLALATSIVG IFITILMFVT 
LRKKIGPLGM KAMSFKFFKI LVSSLLMGVI AHISYRYLEN FAGSNISIII SITGGALIYF 
VIIYFMKIED VEVLVKQFKR KLFGRKKQLN NG