Gene Cthe_1461 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cthe_1461
Symbol
ID	4810611
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium thermocellum ATCC 27405
Kingdom	Bacteria
Replicon accession	NC_009012
Strand	+
Start bp	1780355
End bp	1781920
Gene Length	1566 bp
Protein Length	521 aa
Translation table	11
GC content	43%
IMG OID	640106882
Product	FAD dependent oxidoreductase
Protein accession	YP_001037883
Protein GI	125973973
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0665] Glycine/D-amino acid oxidases (deaminating)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	36
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCATAG AGCAACAAAA AATTTTTGCC AAACCGCCCC AGTCATATTG GATGGCTTCT 
ACCCCTAAAG CCAATTATCC AACCCTGGAA GAAGACATAA AAGTTGATGT TGCAATTATC 
GGAGGGGGTA TCACCGGTAT CGCCACTTCC TACATGCTTG GCAAAGCCGG CGTAAAAGTG 
GCTGTTATTG AAGCCGACCG CATTTTACAA GGCACAACCG GCCATACCAC GGCAAAAATA 
ACATCCCAGC ATGACCTGAT ATACAGTAAA ATATACAGCC AAATGGGCAG GGAATTGGCA 
CAGCAATATG CCGATGCAAA CGAATCTGCC ATTCGGATGA TTGAAAAAAT AGCAACTGAA 
AATGGCATCG AATGCGATTT CGTTCCCCAA TCCGCATATG TGTATACAAT GCAAGACAAG 
TATATCGACA AAATAAAAGA TGAAGCCGTG ATTGCCGAAT TCCTCGGTAT AAAAGCCACA 
TACCTTGAAG AAATACCTTT GCCCTTCCCA ATTAAAGCCG CGGTCCGCTT TGACAACCAG 
GCCCAGTTCC ATCCCCGAAA ATTTCTGCTG CGCCTAGCAG AGGAAATTGT TAAAAGCGGC 
AATCAAATAT TCGAGCAAAG CAGAATTGTG GACATTGAAG ATGATAACAA CTATGTTTTA 
ATTACAAATC AAGGCAAAAA GGTAACTGCG GAAAAGCTTA TTATCGCTTC CCATTACCCA 
TGTTACAATA AAGCCGGGCT ATACTTTACA AGACTATATC CGGAACGGTC ATATGTTGTT 
GCCATAAAAG CAAAAGAAAG TTATCCCGGC GGAATGTATA TAAACATGGA AGAGCCAAAG 
CGCTCACTCC GCAGCCAAAG GTCAGATGAC GGCGAACTGA TACTGGTCGG CGGTGAAAGT 
CACAAAACCG GACAAGGTGA GGATACAATC AAGCATTATG AAGCGTTGAT AGATTATGCC 
ACTAAAACTT TTACGGTAGA AGATATTCCT TACCGGTGGT CCACCCAGGA TTGCATGACC 
TTGGACGGAC TGCCTTATGT GGGGCATTTC ACATCAAACA CTCCAAATAT GTACATCGCA 
ACCGGTTACG GCAAGTGGGG AATGACCAAC AGCATAGCTT CCGCGATGAT ATTAAGGGAT 
TTGATAATTG AGGGAAAAAG TCCCTGGCAG GATGTTTACA ACCCGTCACG CAAAACAGTG 
TTGGCCTCCG CTAAAAACTT TATTGTTGAA AATCTTAACG TCGCAGAAAA ACTAATTGAA 
GGAAAAATCT TGCCCATGGC GGACAATACC GATATTAAAG CCGGAGAAGG AAAAATTATC 
AACGTGAACG GTCAGAGACT CGGAGCATAC AGAGACCAAC AAGGTACTCT GCACGTCGTA 
GACACAACAT GTACGCATAT GGGTTGTGAA TTATACTGGA ACTCTGCCGA AAAATCCTGG 
GATTGTCCCT GCCATGGCTC AAGGTTTACC TATGAGGGCG ATATAATTGA AGGACCGGCA 
GTTACGCCTT TAAATGTACA CCGTGATGTG AACACAATTG AAAAACTTTT TAAAGACAAT 
TTTTAA

Protein sequence

MSIEQQKIFA KPPQSYWMAS TPKANYPTLE EDIKVDVAII GGGITGIATS YMLGKAGVKV 
AVIEADRILQ GTTGHTTAKI TSQHDLIYSK IYSQMGRELA QQYADANESA IRMIEKIATE 
NGIECDFVPQ SAYVYTMQDK YIDKIKDEAV IAEFLGIKAT YLEEIPLPFP IKAAVRFDNQ 
AQFHPRKFLL RLAEEIVKSG NQIFEQSRIV DIEDDNNYVL ITNQGKKVTA EKLIIASHYP 
CYNKAGLYFT RLYPERSYVV AIKAKESYPG GMYINMEEPK RSLRSQRSDD GELILVGGES 
HKTGQGEDTI KHYEALIDYA TKTFTVEDIP YRWSTQDCMT LDGLPYVGHF TSNTPNMYIA 
TGYGKWGMTN SIASAMILRD LIIEGKSPWQ DVYNPSRKTV LASAKNFIVE NLNVAEKLIE 
GKILPMADNT DIKAGEGKII NVNGQRLGAY RDQQGTLHVV DTTCTHMGCE LYWNSAEKSW 
DCPCHGSRFT YEGDIIEGPA VTPLNVHRDV NTIEKLFKDN F