Gene Apar_0392 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Apar_0392
Symbol
ID	8413241
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Atopobium parvulum DSM 20469
Kingdom	Bacteria
Replicon accession	NC_013203
Strand	+
Start bp	453323
End bp	454378
Gene Length	1056 bp
Protein Length	351 aa
Translation table	11
GC content	45%
IMG OID	645021960
Product	NMT1/THI5 like domain protein
Protein accession	YP_003179414
Protein GI	257784197
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0715] ABC-type nitrate/sulfonate/bicarbonate transport systems, periplasmic components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATGCAT CAAATTGCAA GAGTATGACA AGAAAAGGCT TTCTAGCTGC GATGGGTTTC 
TCGACAGCAG GATTTTGCGC AGGTTGCTCG CTTGAACAAC CATCTGCTCC GTCAAACGGT 
GGTAACAATG GCACGGGCCA AAATACTGGT GGTACTACAG AGATTACGTT TGCCCTGGAC 
TATACGCCAA ATACCAATCA CACCGGCATT TATGTAGCTC AGGAAAAGGG CTACTTTGAC 
GAAGTAGGCC TCAAGGTAAC CATTCAGCAG CCACCCGCTG ACGGTGCTGA TGCGTTGATT 
GGTGCTGGTG GTGCCCAGAT GGGTGTTACC TATCAGGACT ATATTGCTAA TAGTCTCTCG 
TCATCTAATC CACTACCGTA TACTGCGGTT GCCGCTATCA TTCAGCACAA TCTTTCGGGC 
ATTATGAGCC GTGAAGATGA TCATATTGTT CGTCCGCGTG ACCTTAATAA CCATACTTAC 
GCAACGTGGA ATCTTCCTGT TGAACAGGCT ACTATCAGGT CTGTTATAGA GTCTGATGGC 
GGAGATCCTT CAACGCTTAA GATGGTACCT TATGAGGTAG ATGATGAGGT ATCTGGCTTA 
AAAGCAAAGA TGTTTGATGC TGTTTGGGTG TATGAGCAGT GGGCTGTTCA AAACGCTCGT 
GTTCAGAATT TTGCATACAA TTATTTTGCC TTTTCAGCTA TTGATCAAAA CTTTGATTAC 
TACACGCCAG TCATTGCGGC AAACGATGAC TTTGCAAAAA AGAACCCAGA TGCTGTTAAA 
GCATTTTTGA GCGCTACCAG AAAGGGTTAT GAGTTCTGTG TTTCTAATCC TGACGAGGCA 
GCAGAGATTC TGCTCAAAGC TGTTCCAGAA CTTGATGCTG ATCTGGTCAA AGCCTCTCAG 
AAGTTCCTAG CCTCTAAGTA TATTGACGAC GCTGAGAAGT GGGGCGTTAT TGATTCAGCT 
CGCTGGCAGC GTTTTTATAA CTGGCTTAAC AACCAAAAGC TACTAGAGAA TAAGATTGAT 
CCATCCGCAG GATTTACTAG TGAGTACCTT GGATAA

Protein sequence

MNASNCKSMT RKGFLAAMGF STAGFCAGCS LEQPSAPSNG GNNGTGQNTG GTTEITFALD 
YTPNTNHTGI YVAQEKGYFD EVGLKVTIQQ PPADGADALI GAGGAQMGVT YQDYIANSLS 
SSNPLPYTAV AAIIQHNLSG IMSREDDHIV RPRDLNNHTY ATWNLPVEQA TIRSVIESDG 
GDPSTLKMVP YEVDDEVSGL KAKMFDAVWV YEQWAVQNAR VQNFAYNYFA FSAIDQNFDY 
YTPVIAANDD FAKKNPDAVK AFLSATRKGY EFCVSNPDEA AEILLKAVPE LDADLVKASQ 
KFLASKYIDD AEKWGVIDSA RWQRFYNWLN NQKLLENKID PSAGFTSEYL G