Gene TK90_2031 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TK90_2031
Symbol
ID	8807806
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Thioalkalivibrio sp. K90mix
Kingdom	Bacteria
Replicon accession	NC_013889
Strand	-
Start bp	2151401
End bp	2152729
Gene Length	1329 bp
Protein Length	442 aa
Translation table	11
GC content	67%
IMG OID
Product	PGAP1 family protein
Protein accession	YP_003461258
Protein GI	289209192
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	48
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGGCGGCG AGACGCACGA GCCGCTTGTT GGACTGATCC GGGTGGGCAG GAAGGCGGAC 
ATGGACGGAG CAAGGATTGC CGCGCTGGTG CTGGCGGCGG GGTGGCTGAC GGGCTGCGGG 
TTGTGGGATG CGCGTGGACA AATGCAGATG ATGGGCCAGG CCTGCACGAT TTCCGGCACC 
GTAGTGGCGG ATGACGCGGT CCCGGGGCCG TATGTGGTCG CGGTATTCCG CGCGCCGATG 
GAGGAGGGCG CGGTTCCGGA ACCGGTGGAC CATGTCGTGA GTGCCGGTGG CGGCGAGTGG 
TTCTTTGGCT TGGCGCCGGG GCGTTACCAG GTCCTGGCCT TTGCCGACCC CGAACGTGAC 
GGCCAGCACG AGGCGGGGGC GCCGGTATAC CTGGCGAACC AGGGCGGCAT GCTGGACTGC 
CCTGCGGGCA CGCGCTTGGG CAATATGGAG ATCCAGATCG AGGGTGAAGG GGTCGCGGGG 
CATGCGATCG CGCTGCCCGT CATGCGCGGT GCCGGTCCGG ATGGCAGTCC CATCAGCGTT 
GGGGGGGTCA CGGCGTTCGG GGAAGTGACC ACGCTGGATG ATCCGCGTTT CGACGACGAT 
GTCGCGCGCG GGAGCCAGTG GCGGCCGGTG GATTTCATGC TGGCTGGTTA TGCCGGGATC 
TATTTCCTGG AGCCCTACGA CCCCGACCGC ATCCCGGTGC TGTTCGTGCA TGGGATGAAT 
GGCTCCCCGC GGGGGTTCGC CGAACTCATC GACCAACTCG ATCGCGAGCG CTACCAGCCC 
TGGCTGTATT ACTACCCGTC CGGGCTCCCC CTGCAGTCCA TCGCCGCACA CCTGGCCCAG 
ACTCTGGAAG AAATCGAGTT GCGCTATGAA GTGGAGTCGC TGCCGGTCGT TGCGCACAGT 
ATGGGCGGCC TGGTGGCAAA GGGCTTTCTG CATGAGCGCG CACGTCGCGC GTCGCCGGCC 
CATATCCCGC GAATGATTGC GCTGTCTACG CCCTGGCATG GGCATGCGGC TGCGCAGTCG 
GGGGTCGATC GCTCGCCGGT GGTGATCCCG GTCTGGCGCG ACATGGTGCC CGGTAGTGAA 
TACCAGCGGC GGTTGTTCGA GTCGGAGCTG TTGGAGGAGA CCGAACTGCA TCTGCTGTTC 
AGCTTCCGCC GCCCGGAAAG CGGGGCGCGT GCGGGTACGG ACGGCGTGCT CACCCTGGCG 
ACCATGCTGT ACCCCCCGAT TCAGGCGATG GCGAGCAGCG TCTATGGGGT GGATACCACG 
CATGCGGGGA TTCTCACGCA TCCGATGGCG CTGGAGCGGG TGCAGATGCT GCTCGAGTCT 
GGCTCCTGA

Protein sequence

MGGETHEPLV GLIRVGRKAD MDGARIAALV LAAGWLTGCG LWDARGQMQM MGQACTISGT 
VVADDAVPGP YVVAVFRAPM EEGAVPEPVD HVVSAGGGEW FFGLAPGRYQ VLAFADPERD 
GQHEAGAPVY LANQGGMLDC PAGTRLGNME IQIEGEGVAG HAIALPVMRG AGPDGSPISV 
GGVTAFGEVT TLDDPRFDDD VARGSQWRPV DFMLAGYAGI YFLEPYDPDR IPVLFVHGMN 
GSPRGFAELI DQLDRERYQP WLYYYPSGLP LQSIAAHLAQ TLEEIELRYE VESLPVVAHS 
MGGLVAKGFL HERARRASPA HIPRMIALST PWHGHAAAQS GVDRSPVVIP VWRDMVPGSE 
YQRRLFESEL LEETELHLLF SFRRPESGAR AGTDGVLTLA TMLYPPIQAM ASSVYGVDTT 
HAGILTHPMA LERVQMLLES GS