Gene Acry_2089 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acry_2089
Symbol
ID	5161688
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Acidiphilium cryptum JF-5
Kingdom	Bacteria
Replicon accession	NC_009484
Strand	-
Start bp	2301634
End bp	2303004
Gene Length	1371 bp
Protein Length	456 aa
Translation table	11
GC content	73%
IMG OID	640554011
Product	OmpA/MotB domain-containing protein
Protein accession	YP_001235207
Protein GI	148261080
COG category	[N] Cell motility [S] Function unknown
COG ID	[COG1360] Flagellar motor protein [COG3455] Uncharacterized protein conserved in bacteria
TIGRFAM ID	[TIGR03349] type IV / VI secretion system protein, DotU family [TIGR03350] type VI secretion system OmpA/MotB family protein

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.975848
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCGACA ATCCGTTTGC CGAACCAGAC GATTCCGACC GCACGATCAT CAGGCCGGCG 
CCGGGCGGCC GGCGTCCCCC GCCCGCGCCG CCGCCGCCGC CGCCAACCGG CGGTGGCGAC 
CCTTGGAGCG AGCCGCCGCG GCCGGCATCC CCGCCGCCCG CGGGCGGCGC GGAGACGCTG 
AATATCGGCT CGACGCCGCT GATGGCGGCC GCGGCCCCCC TGCTGCAGTT GCTCGCTCGC 
TTGCGCAACA CCCTGGCCCA GCCCGATTCG GGCGATCTGC GCGAACGCAC CGCCCGCGCG 
TTGCGCGACT TCGAGCAGGC GGGCCGCAAT GCGGGCATTC CGAACGACCA GCTGCGCCCC 
GCGCATTACG CCCTGTGCGC CAGCCTCGAT GACGTGGTGC TCGCCACCCC CTGGGGCAGC 
AGCGGCGCCT GGGCCGCGCG CTCGATGGTG TCCACCTTCC ATCAGGAGGT CCGCTCCGGC 
GAGCGCTTCT TCGACATCCT CAAGCAGATC ATGCAGAACC CGGGCCGGTT CCTGCCGGTT 
CTCGAGCTGA TGTATATCTG CCTCTCGCTC GGCTACATGG GGCGCTACCG GCTCAGTCCG 
CGCGGCCCCG CCGAGATCGA CCGGCTGCGC GAGGATGTCT ATGCCGTCCT CCGCCGCGCC 
CGCCCGGCCG CCAGCCCCGA ACTGGCGCCC CACTGGCAGG GCGTTGCGGC GCCCTACCGC 
CCGCGCCGCC CGTCCCTGCC GGTCTGGGTC GCCGCGGTGG CGGCCGCCGG GGTGCTGGCC 
CTTGTCTACG CGGCCTTCGA CTACGGGCTC GGCGGCCAGT CCGCCACGCT CTACGCGCAG 
TCGGTCGCCG CCCACCCGGC GCGGATGCCG AAGATCGTCC GCGCCGCCGC CGTCGTGCCG 
CCGCCGCCGC CGGTCACCAC CGGCCCGAAC GTGCTCGACC GGCTGCGCGG CTTCCTGCAA 
CCCGAAATCA CCAAGGGCGA GGTCGCCGTG CTCGGCACCG TCAACGCGCC GGTCATCCGC 
ATCAACAACA CCGGCCTGTT CGCCTCCGGC AGCGCGACGG TCGAGAGCAC CGCGCTGCCG 
CTGATTTCCA AGATCGGCCA GGCGCTGGCG CGCGAGAAGG GCAAGGTGCA GGTGATCGGC 
TATACCGACA GCCAGCCGAT CCACACGCTG CGCTTCCCCA ACAACCTGGT CCTCTCGGAG 
GACCGCGCGA AGGCGGCGGC CGCCGTGCTC GACCGCGCGA TCGGCGATCA GAGCCGCATC 
ACCGCGGAGG GGCGCGGCGC CGCCGACCCG ATCGCGACCA ACGCGACGCC GCAGGGGCGC 
GCCCTGAACC GGCGGATCGA AATCGTGCTG ATCCGGAGTG AAACCCAATG A

Protein sequence

MSDNPFAEPD DSDRTIIRPA PGGRRPPPAP PPPPPTGGGD PWSEPPRPAS PPPAGGAETL 
NIGSTPLMAA AAPLLQLLAR LRNTLAQPDS GDLRERTARA LRDFEQAGRN AGIPNDQLRP 
AHYALCASLD DVVLATPWGS SGAWAARSMV STFHQEVRSG ERFFDILKQI MQNPGRFLPV 
LELMYICLSL GYMGRYRLSP RGPAEIDRLR EDVYAVLRRA RPAASPELAP HWQGVAAPYR 
PRRPSLPVWV AAVAAAGVLA LVYAAFDYGL GGQSATLYAQ SVAAHPARMP KIVRAAAVVP 
PPPPVTTGPN VLDRLRGFLQ PEITKGEVAV LGTVNAPVIR INNTGLFASG SATVESTALP 
LISKIGQALA REKGKVQVIG YTDSQPIHTL RFPNNLVLSE DRAKAAAAVL DRAIGDQSRI 
TAEGRGAADP IATNATPQGR ALNRRIEIVL IRSETQ