Gene Tneu_0420 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tneu_0420
Symbol
ID	6166066
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Thermoproteus neutrophilus V24Sta
Kingdom	Archaea
Replicon accession	NC_010525
Strand	-
Start bp	377649
End bp	379538
Gene Length	1890 bp
Protein Length	629 aa
Translation table	11
GC content	62%
IMG OID	641667578
Product	AMP-dependent synthetase and ligase
Protein accession	YP_001793814
Protein GI	171184895
COG category	[I] Lipid transport and metabolism
COG ID	[COG0365] Acyl-coenzyme A synthetases/AMP-(fatty) acid ligases
TIGRFAM ID	[TIGR02188] acetate--CoA ligase

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.0761365
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCGCGG AGTTCGTAGA GGTATACAGG AAGTCGCTGG AGGACCCCAT CGGCTTCTGG 
GAGAAGCAGG CGGAGAGGCT GTACTGGAGG GAGAGGTGGG AGAAGACCTA CGACGACTCC 
AACCCCCCCT TCTACAGGTG GTTCGTAGGC GGCAAGACCA ACATCTCCTA CAACGCCCTA 
GATAGGCACG TTAAAGGCGG GAGGGCCAAC AAGGCGGCGT TGATCTGGGT CTCGGCAGAC 
GGCGCCACCA GGGTGCTCAG GTACTGGGAC CTCTACAGGG AGGTCAACCG CTTCGCCGTG 
CTTCTGAAGA GCCTCGGCGT AGAGCGGGGC GACAGAGTGG CGATATACAT GCCGATGATA 
CCCGAGGCCA TGGTGGCGAT GTTGGCCGTG AACAGAATAG GGGCTGTGCA CACGGTGGTC 
TTCTCCGGCT TCGGCCCCCA GGCGCTCGCC GAGAGGATAA AAGACGCCGA GGCCAAGGTG 
GTGATAACCG CAGACGGCAT GAGGAGGCGC GGCAGGGTGA TCCCCCTGAA GCCCACGGTA 
GACGAGGCGC TGAAGATAGT GGGCAACGAC ATATTCACGG TGGTGTACAA ACACACGGGG 
GTCGAGGTCC CCATGAAGCA GGGCAGAGAC CTCTGGTGGC AGGAGGAGAT AGCCAAGATC 
CCCCCAAACA CCTACATAGA GCCCGAGTGG GTGCCCGGGG AGGCGCCGCT CTTCATACTG 
TACACCTCCG GCACAACCGG CAAGCCGAAG GGCATACTCC ACCTACACGG CCAGTACATG 
GTGTGGATCT GGTACGCCTT CAACCACCTC ACCGGAGCCG AGAGGGACTT CAGAGAGGAC 
ATAGTCTTCT TCTCCACAGC AGACATAGGC TGGATCTCCG GCCACCACTA CGGCGTCCAC 
GGCCCCCTCC TCAACGGCCT GACCGTCCTC TGGTATGAAG ACGCCCCCGA CTACCCCCAC 
CCCGGCATCT GGTGGGAGAT CGCCGACACC TACAAGGTCA CCCACATGTT GTTCTCCCCC 
ACCGCCATCA GGCTGTTGAT GAAATACGGC GACGAGTGGC CCAGGAGGTA CAAGCTAGAC 
AGCATAATGG CCCTCTACCC CACCGGCGAG GTCCTCAACG AGGAGGCCTA CAACTGGATG 
AGGCGGGAGG TATGTAGGGG GAGGCCCGAC TGTCAGATAG CCGACATATG GGGCCAGACC 
GAGACCGCCT GCTTCGTCAC AGCCCCCGGC TCCATGAACC TAGGCGGCTT CCGCTACAAA 
TACGGCTCGG TGGGCATGCC CTACCCCACC CTCAACCTGC AGATCCTAGA CGACGATGGG 
AAGCCGCTTC CGCCCGGCGC CAAGGGACAC GTGGTGGCCA AGCCTCCGCT GCCCCCCGCC 
TTCCTACACA CCCTGTGGCG CGACCCGGAG AGATACGTCA AGTCCTACTG GTCCCGCTTC 
CCAGGCTACT ACTACACCGG CGACCTCGGC TACATAGACC AAGACGGCCA CCTCCACATA 
ATGGGCCGCT CCGACGACGT GATAAAGGTG GCCGGCCACA GGCTCTCCAC CAGGGAGGTG 
GAGGACATAC TCACCAGCCA CCCCGCCGTA GCCGAAGCCG CCGTGGTGGG CGTGCCAGAC 
GAGGTCAGAG GCGAGGTGCT GGGGGTCTTC GTGGTGCCCA AACAAGGCAT GAAAATCACG 
GAGGAGGAGG TGGTTAAACA CCTCAGGAAC TCCCTCGGCC CCGTGGCGGT CATTGGAAAA 
GTCGCGATAC TGGATAAGCT CCCCAAGACC AGGACAGGCA AAGTCATGAG GAGGGTGCTG 
AGGGCCATGG CCACCGGGCA ACCCGTAGGC GACCTAAGCA CCCTAGAAGA CGAGGAGGCC 
CTGGAGGAGC TAAGGAAAAA ACTCGGCTAA

Protein sequence

MSAEFVEVYR KSLEDPIGFW EKQAERLYWR ERWEKTYDDS NPPFYRWFVG GKTNISYNAL 
DRHVKGGRAN KAALIWVSAD GATRVLRYWD LYREVNRFAV LLKSLGVERG DRVAIYMPMI 
PEAMVAMLAV NRIGAVHTVV FSGFGPQALA ERIKDAEAKV VITADGMRRR GRVIPLKPTV 
DEALKIVGND IFTVVYKHTG VEVPMKQGRD LWWQEEIAKI PPNTYIEPEW VPGEAPLFIL 
YTSGTTGKPK GILHLHGQYM VWIWYAFNHL TGAERDFRED IVFFSTADIG WISGHHYGVH 
GPLLNGLTVL WYEDAPDYPH PGIWWEIADT YKVTHMLFSP TAIRLLMKYG DEWPRRYKLD 
SIMALYPTGE VLNEEAYNWM RREVCRGRPD CQIADIWGQT ETACFVTAPG SMNLGGFRYK 
YGSVGMPYPT LNLQILDDDG KPLPPGAKGH VVAKPPLPPA FLHTLWRDPE RYVKSYWSRF 
PGYYYTGDLG YIDQDGHLHI MGRSDDVIKV AGHRLSTREV EDILTSHPAV AEAAVVGVPD 
EVRGEVLGVF VVPKQGMKIT EEEVVKHLRN SLGPVAVIGK VAILDKLPKT RTGKVMRRVL 
RAMATGQPVG DLSTLEDEEA LEELRKKLG