Gene Tneu_1644 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tneu_1644
Symbol
ID	6165476
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Thermoproteus neutrophilus V24Sta
Kingdom	Archaea
Replicon accession	NC_010525
Strand	+
Start bp	1452067
End bp	1453278
Gene Length	1212 bp
Protein Length	403 aa
Translation table	11
GC content	58%
IMG OID	641668807
Product	basic membrane lipoprotein
Protein accession	YP_001795012
Protein GI	171186093
COG category	[R] General function prediction only
COG ID	[COG1744] Uncharacterized ABC-type transport system, periplasmic component/surface lipoprotein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	0.848912
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	40
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACAAGA TCTGGATCGC TCTTGGGGTA GTTGTAGCGA TCGCGGTTAT TGGGGCGCTT 
CTCGCGACGC AGTCGGCGCA GAAACAACAG CCTACTACAC AACCCCCGCC CCAGAAGACT 
ATATACGTTA TATACGACAT CGGGGGGCGC GGGGACCTCT CATTCAACGA CATGGCGTAT 
CTAGGGGCCT CTAAAGCCGC TAGAGACTTC GGGCTCGGGC TTAAGGAGGT GCAGAGCAAA 
ACCCAAGACG ACTACGTGCC CAATTTGAGA GCAGCCGCGA GATCAGGAGA CGCCGCTTTG 
GTGGTCGCAG TCGGGTTCCT TATGACAGAC GCGCTGAAGC AGGTTTCGCA GGAATACCCC 
GCCGTCCACT TCGCGATTAT AGACGGCTAT GTGCCCAACA GGTCAAACGT GGTTTCCGTC 
CTCTACCGCG AAAACGAGGG CTCGGCGCTG GTCGGCGCTC TGGCGGCGCT CACAGCCTAC 
TACTACAACT GCACCAAGGT TGGGATAGTG CTGGGGATGG AGATCCCCGT CCTCTGGAAG 
TTCGAGATCG GGTATGCCTA CGGCGTGAGG TGGGCTGAGA GGTATATAAA GCAGAGGTTT 
GGCAAAGACG TAAAATTCGA CGTCTTGTAC GTATACACAG GGTCCTTCAA CGATCCAGCT 
AAGGGCAAGC AAGCTGCTGA GGTCATGCTG TCGCAAGGCG TATGCGTGAT ATACCAAGCG 
GCCGGCGCCA CGGGCCTAGG CGTGTTTGAG GCTGTGGCTG AGGCGGGGAA GAGGGCGGGC 
AGAAACATGG GCCCGCCCTT CGCCATAGGC GTAGACGCCG ACCAGGACTA CATCAAGCCG 
GGGTTCATAC TGGCCTCTAT GATGAAGCGC GTCGACGTCG GCGTCTACAG AGCGGCTAAG 
ATGGCCGTCG AGGGAACCTT CAAAGGCGGC GTCTTGGAGC TTGGCCTCAA GGAGGGCGGC 
GTGTCTGTGA GCACCTTGGA CGACCTAGGC CAGTTCCTCG AGATAGGGAT AAGAGCCGGC 
GCTGTGAAGC AGGAGGACGC CCAGAGGATC ATCGATACCG TGAAGGAGAT GAGGTCTAAG 
ATCCCCACCT GGGTGTGGGA GGCCGTGGAC AAGCTTAGGC AGGACATAGT GGCTGGCGTG 
GAGAAGGTGC CTCTGCCTAC GACACAGGAC CAGGTTGTGA AGCTGAGGAG AGAGCTGGGC 
TTAGCCGGCT GA

Protein sequence

MNKIWIALGV VVAIAVIGAL LATQSAQKQQ PTTQPPPQKT IYVIYDIGGR GDLSFNDMAY 
LGASKAARDF GLGLKEVQSK TQDDYVPNLR AAARSGDAAL VVAVGFLMTD ALKQVSQEYP 
AVHFAIIDGY VPNRSNVVSV LYRENEGSAL VGALAALTAY YYNCTKVGIV LGMEIPVLWK 
FEIGYAYGVR WAERYIKQRF GKDVKFDVLY VYTGSFNDPA KGKQAAEVML SQGVCVIYQA 
AGATGLGVFE AVAEAGKRAG RNMGPPFAIG VDADQDYIKP GFILASMMKR VDVGVYRAAK 
MAVEGTFKGG VLELGLKEGG VSVSTLDDLG QFLEIGIRAG AVKQEDAQRI IDTVKEMRSK 
IPTWVWEAVD KLRQDIVAGV EKVPLPTTQD QVVKLRRELG LAG