Gene Tneu_0235 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tneu_0235
Symbol
ID	6165917
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Thermoproteus neutrophilus V24Sta
Kingdom	Archaea
Replicon accession	NC_010525
Strand	-
Start bp	207645
End bp	209084
Gene Length	1440 bp
Protein Length	479 aa
Translation table	11
GC content	65%
IMG OID	641667398
Product	4-alpha-glucanotransferase
Protein accession	YP_001793634
Protein GI	171184715
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1640] 4-alpha-glucanotransferase
TIGRFAM ID	[TIGR00217] 4-alpha-glucanotransferase

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	0.788709
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	0.23673
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCTTCGGG GCTTTGGAGT ACTTCTCCAC ATATCTAGCC TCCCCGGGGG TTGCCTAGTC 
GGCGACCTGG GGCCCTCCGC CTATAGATTC GCCGACTTCC TATCCGAAGC CGAGGCCACC 
TACTGGCAGA TCCTGCCGCT GAGCCACACG CTACCTGAAT ACGACGACTC CCCCTACAGC 
GCAGCCTCGC TGCTGGCTGG AAACCCGGCC CTCGTCAGCC TGGAGAAGAT GGCCCAGCTG 
GGGTTGGCGA AGAGGGCGCC GCCCAGCTGT CCGCCCGCCG AGAGGGCGCG TTTCGCAGAG 
GCTTGGGAGC TCAAGAGGCG GTATCTTGAG GAGGCCTTCG AGGGAAGGCT GGGCTGGCGG 
GATTACGAGG AGTTCGCCGC CCGAAATAGC TGGTGGCTGG AGCCCTACGG TAGATACATG 
GCGCTAAGGG AGGCCTTCGG GGGGCCGTGG ACCGCCTGGC CCGCCTGGGC GAGGAGACCC 
AACGCCGATC TGCCGCCACG CCTAGAAAGG AGGGCGGATT TCTACAGATA CGTCCAGTTC 
CACTTCTGGC TACAGTGGGA GGAGCTGAAG AGATACGTCA ACAGCCTCGG CGTATTTATC 
ATAGGCGACC TCCCCATATA CCCGGCGTTA GACAGCGCCG ACGTGTGGGA GGGGCAGAGG 
TACTTCAAGC TGGCGCCCGA CGGCGCCCCC CTCTACGTCT CCGGGGTTCC GCCTGACTAC 
TATTCACCCA CCGGACAACT ATGGGGGACG CCGGTCTACA ACTGGGCGGA GCTGAGGAGA 
GACCGCTACG TCTGGTGGAC CCGGCGCCTT ACGAGGCTAC TCTCCATATT CGACTACATA 
CGCCTCGACC ACTTCAGAGG ATATGCGGCG TATTGGGAGG TGCCCTACGG GGAGCCCACG 
GCCGTAAGGG GGAGGTGGGC GCCGGGGCCC GGCGAGGAGC TTTTCAGAGC CGCCGAAGAT 
GCCCTCCCCA GGCTCATCGC GGAGGACCTG GGCTTCATCA CCCCAGACGT TGTGGAGCTC 
AGGTATAGGC TGGGCATACC CGGCATGCGC GTGCTCCAGT TCGCATGGGA CGGCAACCCC 
GCCAACGAGC ACAAGCCGCA CAACTACGAG AGGAACCTTG TGGCGTACAC CGGAACACAC 
GACAACAACA CCACCCTAGG CTGGTGGAGG GAGGAGACAA CGCCGAGGTC GAGGCGCGAG 
GCCCTCGCCT ACATGGGCGG CTGCAGAGGC GGTGTGAGCT GGTGCTTCAT ACGCCTCCTC 
TTCTCCACCG TGGCCGACGT GGCCGTAGTC CCGATGCAGG ACGCCCTCGG GCTAGGTAGT 
GAGGCTCGGA TGAACAAGCC CGGCACCGCG AGGGGCAACT GGAAGTGGAG GATGGCCGGA 
GACCCGCCCC GGGCTGTGGC GGCGCGGCTC AGGCGCCTTG CAAGGATCTA CGGGCGCTGA

Protein sequence

MLRGFGVLLH ISSLPGGCLV GDLGPSAYRF ADFLSEAEAT YWQILPLSHT LPEYDDSPYS 
AASLLAGNPA LVSLEKMAQL GLAKRAPPSC PPAERARFAE AWELKRRYLE EAFEGRLGWR 
DYEEFAARNS WWLEPYGRYM ALREAFGGPW TAWPAWARRP NADLPPRLER RADFYRYVQF 
HFWLQWEELK RYVNSLGVFI IGDLPIYPAL DSADVWEGQR YFKLAPDGAP LYVSGVPPDY 
YSPTGQLWGT PVYNWAELRR DRYVWWTRRL TRLLSIFDYI RLDHFRGYAA YWEVPYGEPT 
AVRGRWAPGP GEELFRAAED ALPRLIAEDL GFITPDVVEL RYRLGIPGMR VLQFAWDGNP 
ANEHKPHNYE RNLVAYTGTH DNNTTLGWWR EETTPRSRRE ALAYMGGCRG GVSWCFIRLL 
FSTVADVAVV PMQDALGLGS EARMNKPGTA RGNWKWRMAG DPPRAVAARL RRLARIYGR