Gene Apar_0252 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Apar_0252
Symbol
ID	8413100
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Atopobium parvulum DSM 20469
Kingdom	Bacteria
Replicon accession	NC_013203
Strand	+
Start bp	293046
End bp	294104
Gene Length	1059 bp
Protein Length	352 aa
Translation table	11
GC content	41%
IMG OID	645021819
Product	selenide, water dikinase
Protein accession	YP_003179274
Protein GI	257784057
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0709] Selenophosphate synthase
TIGRFAM ID	[TIGR00476] selenium donor protein

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.0491527
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTAATG ACGTAAAACT CACAAAACTT GCTGATTGTG CTGGTTGTGG TGCTAAGGTT 
GGTGCCGGTG AGTTGGCAAA GCTTCTTTCA GATATTAAAG TTCATGAGGA TCCTAATTTA 
TTAGTTGGTT TTGATAAAGC GGATGATGCA GCTGTTTACA AAGTGACTGA TGAAATAGCG 
CTTGTCGAAA CAATCGATTT CTTTCCTCCA ATTGCTGATG ACCCATATAC GTATGGCGCT 
ATTGCGGCTA CCAATGCTTT ATCGGATGTA TATGCTATGG GTGGAGAGCC AAAGGTTGCT 
CTTAATGTTA TGGCTGTACC CGAAGACATG TCCTCGCATG TAGTGTATGA GATTTTACGT 
GGTGGTTACG ATAAAGTATA TGAGGCTGGT GCCAATATTG TTGGCGGTCA TAGCATCTAT 
GACAATGAAC CAAAATATGG TCTTGCTGTT TCAGGGTTTG TTAATCCAAA AAAGATGTAT 
ACCAATTCTG GTGCACGTGC AGATGACGTT TTAATTCTTA CAAAGGCTCT TGGTGTAGGT 
GTTCTGACAA CGGCTGCTAA AGCAGATATG CTCTCTATAG AAGAGATGAG TGTTGCTGAG 
GCGTCTATGA TGACTCTTAA TCGGTACGCT CGAGACATTA TGGTGAACTA TGACGTGCAT 
GCTGTTACGG ATGTAACGGG ATTTTCACTT ATGGGACATT TGCTTGAAAT GTGTCAGGGT 
TCGGGGCTTT TGGCAAAGAT TACCGTAAAT AATATAAAAT TTTTATCTAC GAGAGTATTT 
GAATTAGCAC GTTTAGGAAT TTTACCAGCT GGTATGTATC GTAATCGTCA CTATGCAGAG 
AAGTACGTGC AAGCAGAAGG GGTTTCTCGT GAGATGAGTG ACGTGCTCTT CTGTCCTGAA 
ACTTCTGGTG GATTATTGAT AAGCGTAGCC CATGATGATG CTCAGCATTT ACTTGCGGCT 
CTTCAAGCAA ATGAACATAC TGCTAATTCT TGTGTTGTGG GATATATGGA AAAGCAAGAC 
ATAAGAAATA AGGATGCAAC TTATATTGTG CTTCAGTAA

Protein sequence

MSNDVKLTKL ADCAGCGAKV GAGELAKLLS DIKVHEDPNL LVGFDKADDA AVYKVTDEIA 
LVETIDFFPP IADDPYTYGA IAATNALSDV YAMGGEPKVA LNVMAVPEDM SSHVVYEILR 
GGYDKVYEAG ANIVGGHSIY DNEPKYGLAV SGFVNPKKMY TNSGARADDV LILTKALGVG 
VLTTAAKADM LSIEEMSVAE ASMMTLNRYA RDIMVNYDVH AVTDVTGFSL MGHLLEMCQG 
SGLLAKITVN NIKFLSTRVF ELARLGILPA GMYRNRHYAE KYVQAEGVSR EMSDVLFCPE 
TSGGLLISVA HDDAQHLLAA LQANEHTANS CVVGYMEKQD IRNKDATYIV LQ