Gene Tneu_0126 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tneu_0126
Symbol
ID	6165824
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Thermoproteus neutrophilus V24Sta
Kingdom	Archaea
Replicon accession	NC_010525
Strand	-
Start bp	112720
End bp	113967
Gene Length	1248 bp
Protein Length	415 aa
Translation table	11
GC content	67%
IMG OID	641667292
Product	hypothetical protein
Protein accession	YP_001793529
Protein GI	171184610
COG category	[R] General function prediction only
COG ID	[COG1571] Predicted DNA-binding protein containing a Zn-ribbon domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.0200734
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.00611159
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAGGGTCG TCGTCGGAAT CGACGACACG GACAGCCACA GGGGGGGATG CACGACGTAC 
GTCGGCTACC TGTTGGCGAA GGAGGTGCTG AGGCGGTGGG GGGCAGGCGC CTTCAGAGAC 
TTCCCGCGTC TCGTGAGGCT TAACCCAAAC GTGCCCTTTA AGACGAGGGG CAACGCCGCC 
GTGGCGCTGG ATCTGGAGAT ACCGGAGGGC GACGTGGAGG AGCTCTGGAG GCTTGCGGTG 
GAGACGGTGG CGGCCCACTC AAGGCGGGAG GGGAAGACGG ACCCAGGTGT GGCCATGGCC 
GCCGGCGGCG TGCCCGAGAG GGCCAAAACG CTGTACCGCA TGGCGCTGAC GCAGGTAGTG 
AGCATAAGCG CGGCGGAAAG GGCGGGGGTC CTCACATGGG GCGGACGGGG GAAGATCGGG 
GCGGTGGCCG CCGTCGGCGC CTACTTCCCC AAGTCCACCT TCGAGCTCAT CGCCTATAGG 
CGGGGCGACA GGGAGGCCAT CCCGCCCGAC CTCGTGAGGC TTCTGGAAGC TCTGACGTAT 
CCCTACACCT TCCACAACGT AGACAGGCGG CGGGTGCTGA TAGAGCCCAG GGGGCCTGAC 
CCGGTCTACT ACGGCATTAG GGGGCTCACC CCACAACACC TCAGATACGC CCTATCTCTC 
CTCGAGGCGT GGGGCTACAG ACCCGCCGGC TGGGTCATAT ATAGGACAAA CCAAGCCACG 
GACGCCCACA TAGAGCTCGG GGTCTTCTAC GGCGACCCCC TCCCCTACTC CTTCTACAGA 
GCCAGGGGGC TGGTGGTGGA GGCGCGGAGG GTAGCCGGGC GGCACCTAGT GGGGAGGCTA 
GACAGCGGCC TCCGCTTCGT GGCCTACAGA CACTTGGGGC GGCTCGCCTC GGAGCTGGAG 
AGGTGCCTCC GGTGCGACGT GGTTCTCTAC GGAGGGCTGA AGCCCAGGAG GGGAGGCCTC 
TACCTATACG TGGAGAGGGC CTACGTGCTG GGCAGGTACA TCCCGGCAAG GAGCCGCTGC 
ACCTACTGCG GGGGATCGCT AGAGAGCCTG GGGAGAGGCA GAGGCTGGAG GTGCAGACGG 
TGCGGCGCCG TCTTCCACAG CGCCCCGATC CGCTGGCTCT ACGACACAGC TCCGCGGAGG 
GCTCTCCTCC CCCGACCCGG CGAGTGGCGC CACCTCCTCA AGCCGCCCGA CGTGGATCCC 
ACAATACCCA ACTTCTTCAG CCCCAGCTCC GCCGAGTGGA TCGGCTAG

Protein sequence

MRVVVGIDDT DSHRGGCTTY VGYLLAKEVL RRWGAGAFRD FPRLVRLNPN VPFKTRGNAA 
VALDLEIPEG DVEELWRLAV ETVAAHSRRE GKTDPGVAMA AGGVPERAKT LYRMALTQVV 
SISAAERAGV LTWGGRGKIG AVAAVGAYFP KSTFELIAYR RGDREAIPPD LVRLLEALTY 
PYTFHNVDRR RVLIEPRGPD PVYYGIRGLT PQHLRYALSL LEAWGYRPAG WVIYRTNQAT 
DAHIELGVFY GDPLPYSFYR ARGLVVEARR VAGRHLVGRL DSGLRFVAYR HLGRLASELE 
RCLRCDVVLY GGLKPRRGGL YLYVERAYVL GRYIPARSRC TYCGGSLESL GRGRGWRCRR 
CGAVFHSAPI RWLYDTAPRR ALLPRPGEWR HLLKPPDVDP TIPNFFSPSS AEWIG