Gene Tbd_1868 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tbd_1868
Symbol
ID	3673978
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Thiobacillus denitrificans ATCC 25259
Kingdom	Bacteria
Replicon accession	NC_007404
Strand	+
Start bp	1963808
End bp	1964938
Gene Length	1131 bp
Protein Length	376 aa
Translation table	11
GC content	67%
IMG OID	637710567
Product	putative glycosyltransferase
Protein accession	YP_315626
Protein GI	74317886
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTGAAG AAAAAAAACT GACCGTACTG CAACTGCTTC CCGCGCTCGA ATCCGGGGGC 
GTCGAGCGCG GGACCGTCGA AATCGCGCAG GCGCTGGTCG AACACGGCCA CCGCGCGCTC 
GTCATGTCCG CCGGTGGGCG CCTCGTCGCC CCGCTGACGC AGGCGGGTGC TCTGCATTTC 
ACCTGGCCGA TCGGCGTCAA GTCGGTGCGA ACGCTCGCGC TCGTCTCGCG CCTGAGAAAA 
TTCCTGAGCG AACAAAAGGT CGACGTCGTC CACGCGCGCT CGCGCGTCCC GGCCTGGATC 
GCTTGGCTCG CCTGGCGCCG CATGGACCCG TCGACGCGGC CGCGCTTCGT CACGACCGTA 
CACGGTCTCT ACGGCGTCAA CCGCTACAGC GCGATCATGG CGCGCGGCGA GCGCGTGATC 
GCAGTCTCCA ACACGGTGCG CGACTACATC CTGCGCGAAT ATCCCAAGAC CCTGCCGTGG 
CGCGTCGACG TCATCCACCG CGGCGTCGAC GGCGCGCTCT ATCCCCATGG CTGGAAACCC 
GATGCCGGCT GGCACGCTGC ATTCTTCGGT CAGTTCCCGA ATGCGGCGGG CAAGCTGCTG 
CTCACCCTGC CCGGTCGCAT CACGCGCCTC AAGGGACATG AGTCCTTCAT CGAACTCGTC 
GCCCGGCTGA AGCGCCGCGG ACTGCCCGTG CATGGCCTGA TCGTCGGCGG CGCGGCAGCG 
TCCAAGCAGC GTTATTTGCA GAAGTTGCGC TACCGCGTGC GCAGCATGGG GCTCGAAGCC 
GACATCAGTT TCACGGGCCA GCGCGACGAC CTGAAAAACA TCCTTGCTAT GTCGAACCTC 
GTGCTCTCTC TGTCGACCCA GCCCGAATCC TTCGGCCGCA CGACGCTCGA AGCGCTGCGG 
CTCGGCGTGC CGACCGCGGG CTTCGATCAC GGCGGCGTAG GGGAAATCCT GCGTACGGTC 
TATCCGGCCG GCTTGCTGCC GATGGACCGC ATCGACGAGG CCTGCCAGCG CATCGCGCAC 
CTGCTGCAGG AGCCCGACGC GGTGCCTGAG GGCGACTTCT TTCCGTTGAA GGCGATGATC 
GAGCGCACGC TCGCGCTCTA CGAACAGCTC GCGCGGGCGC CGCGGCGTTA G

Protein sequence

MSEEKKLTVL QLLPALESGG VERGTVEIAQ ALVEHGHRAL VMSAGGRLVA PLTQAGALHF 
TWPIGVKSVR TLALVSRLRK FLSEQKVDVV HARSRVPAWI AWLAWRRMDP STRPRFVTTV 
HGLYGVNRYS AIMARGERVI AVSNTVRDYI LREYPKTLPW RVDVIHRGVD GALYPHGWKP 
DAGWHAAFFG QFPNAAGKLL LTLPGRITRL KGHESFIELV ARLKRRGLPV HGLIVGGAAA 
SKQRYLQKLR YRVRSMGLEA DISFTGQRDD LKNILAMSNL VLSLSTQPES FGRTTLEALR 
LGVPTAGFDH GGVGEILRTV YPAGLLPMDR IDEACQRIAH LLQEPDAVPE GDFFPLKAMI 
ERTLALYEQL ARAPRR