Gene WD0766 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	WD0766
Symbol
ID	2738857
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Wolbachia endosymbiont of Drosophila melanogaster
Kingdom	Bacteria
Replicon accession	NC_002978
Strand	+
Start bp	738997
End bp	740421
Gene Length	1425 bp
Protein Length	474 aa
Translation table	11
GC content	36%
IMG OID	637172942
Product	ankyrin repeat-containing protein
Protein accession	NP_966522
Protein GI	42520607
COG category	[R] General function prediction only
COG ID	[COG0666] FOG: Ankyrin repeat
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.705844
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAATATG ACAAATTTAT GGAAATATTA AAAAAAATAA ATGACCTTTC AGATTTGAGC 
AAGGACAATA TAGTTGAAAA AATAAAAGCT AAGTTACAAG AAGAAGATCC AGATTTATGT 
CAAAAGTGGG AAAAGAGTAA ACCTGACAAC GATAGTGGAT CTGGCATAAA TTACATATTT 
ACTATATCTC GTGGTCAAAA TTCTCAGGAA GTCAAATTGT TACATTTTGC TTCTTATTGG 
AACTGTGCAA ATGTAGCAAA AGCTCTGATT GAAAACGGGG CAGATATTAA TGCAGAACAT 
GATAATAAAA TTACTCCTTT ACATCTTGCT GCTCACTATG GCCACAAAGA GATAGTACAA 
GTTCTATCAA AAGCAGAAGG AATCAACGTT GATGCAAAAG ATAGTGATGG GTTGACTCCT 
TTACATCTTG CTACTGCAAA TAGCCATAAG GATGTAGTAG AAACTCTAAT TGCAAACAAA 
GTAAATGTTA ATGCAGAAGA TGATGATAGA TGTACACCTT TACATCTTGC TGCTGAAGCG 
AACCACATAG AGGTAGTAAA AATTCTAGTT GAGAAAGCAG ATGTTAATAT AAAGGATGCT 
GATAGATGGA CTCCTTTGCA TGTTGCTGCT GCAAATGGCC ATAAGGATGT AGTAGAAACT 
CTAATTGCAA ACAAAGTAAA TGTTAATGCA GAAGATGATG ATAGATGTAC ACCTTTACAT 
CTTGCTGCTG AAGCGAACCA CATAGAGGTA GTAAAAATTC TAGTTGAGAA AGCAGATGTT 
AATATAAAGG ATGCTGATAG ATGGACTCCT TTGCATGTTG CTGCTGCAAA TGGCCACGAA 
GATGTAGTAA AAACTCTAAT CGCAAAAGGA GCAAAGGTTA AGGCAAAAAA TGGTGATAGA 
CATACTCCTT TACATTTTGC TGCTCAAAAT GGCCACGAAG GTATAGTAAA AGTTCTGCTA 
GAAGCTGGAG CAGACCCTTC ATTAAAAGAT GTTGATGGAA AAACGCCAAG AGACCTCACT 
AAAGATCAAG GTATAATTCA GCTTTTAGAG GAAGCGGAAA AAAAGCAAAC GTTAAAAAAT 
GAGAATAAAA AAACGCCAAA GGATCTTACT GAAAATAAAG ATGTAATGCA GCTTCCAGAG 
AAAAAGGAAG AAAAACAAAT TGGAAAAAAT GCAATTGTGA AAGAAAAAGA ACAATCTGCA 
AAAAATGCAA TTGTAAAAGG TGTTATTGTG TGTTTTGTAA CTGCAGTGAT AGTTGGTGTT 
GCACTTGCAT TTGCTACTGC CCTATCTGTA CCAGCAATAA TTGGACTAGC TGCAGGATCT 
GCGCTCATAG TTGGTGCTGG TCAATATATA ATGTCAAAGC CTAAACCTGA AATGAAAGAA 
GTAAAGGAAC CTGTGCCTAG AGAGACAGAA AAAGCACTTA CTTGA

Protein sequence

MKYDKFMEIL KKINDLSDLS KDNIVEKIKA KLQEEDPDLC QKWEKSKPDN DSGSGINYIF 
TISRGQNSQE VKLLHFASYW NCANVAKALI ENGADINAEH DNKITPLHLA AHYGHKEIVQ 
VLSKAEGINV DAKDSDGLTP LHLATANSHK DVVETLIANK VNVNAEDDDR CTPLHLAAEA 
NHIEVVKILV EKADVNIKDA DRWTPLHVAA ANGHKDVVET LIANKVNVNA EDDDRCTPLH 
LAAEANHIEV VKILVEKADV NIKDADRWTP LHVAAANGHE DVVKTLIAKG AKVKAKNGDR 
HTPLHFAAQN GHEGIVKVLL EAGADPSLKD VDGKTPRDLT KDQGIIQLLE EAEKKQTLKN 
ENKKTPKDLT ENKDVMQLPE KKEEKQIGKN AIVKEKEQSA KNAIVKGVIV CFVTAVIVGV 
ALAFATALSV PAIIGLAAGS ALIVGAGQYI MSKPKPEMKE VKEPVPRETE KALT