Gene Gobs_0698 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gobs_0698
Symbol
ID	8752355
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geodermatophilus obscurus DSM 43160
Kingdom	Bacteria
Replicon accession	NC_013757
Strand	+
Start bp	743203
End bp	744324
Gene Length	1122 bp
Protein Length	373 aa
Translation table	11
GC content	69%
IMG OID
Product	Capsule synthesis protein, CapA
Protein accession	YP_003407846
Protein GI	284989292
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGGCAG GGCGGCACCG GTCGCCGCGG CCGGCCCGGC CCATGCGTGT GCCCGTGCTG 
CTGGTGGCCC TGATTTTCGC GCTGGCCGCC GCGTTCTCGC TGGGCAGCAG CACCGAGAAG 
TCCGCACCCT TGACGTCGGG CAGCTCGCCG CCGCCGCGCG ACACCAGTGT CGGTATCAGT 
GCGGTGGGCA ACGTCATCAT GGGATCGACC CCCGAGTTAC CTCCCGATGG CGGGCGGCAC 
CTGTTCGACG GGGTGGCCGA CCGGCTGGCC GGAGACGTGG TGCTGGCCAA TCTGGATCAG 
GCGCTCACCG ATGCAGCGGC CTCGACCAAG TGCGGAGCAG ACAGCAGTAG CTGCTATGCG 
TTCCGCACGC CGCCCTCGTA TGCCCGGTGG CTGCGCCAGG CCGGTTTCAC GGTGATCAAT 
CTGGCCAACA ACCATTCGCG CGACTTCGGC GATGCCGGGC TGCGCGACAC TCAGGCGGCG 
CTGACCGCTC ACAATCTGCA GTACACCGGC ATGCCGGGGC AGATCACGCT GCAGGACGTC 
GGCTCGGTGC GGGTGGCGAT CCTCGGCTTC GCGCCCTATC ACTGGGCACA AAGCCTGCTC 
GACATTCCCG CCGCCCAACA AATGGTGCGG CAGGCTGCTG CCCAGGCCGA TCTGGTCCTG 
GTCACCATCC ACGCCGGCGC CGAGGGCGCC GACCGCGGGC ACGTACCGCC GGGCACCGAG 
GTTTTCCTCG GCGAGGACCG CGGTGATGCG GTCGCGTTCT CCCACGCGGC CATCGATGCC 
GGCGCTGATG CGGTGCTCGG TGCCGGTCCG CACGTGTTGC GGGGCATGGA GTGGTACCGA 
GGTCGCCTGA TCGCCTACAG CCTGGGCAAC TTCCTGGGCT ACGAGACGCT GTCGCACACC 
GGAGCACAAG GGGTGGGCGG CATCGTGACG CTGCAGCTGA CGCCCGATGG CAGCTGGCAC 
AGCGGACAGC TGGAGGGCAC CGTCATGGTC GCCCCGGGAG TGCCGCAGAT CGATCCCGAC 
CAGCGCGCCC GCGCACTCGT GCAGGAGTTG TCCCGCACCG ACTTCGGCGC CTGCGGCGTG 
CAGCTCTCCG CCGCCGGTGA ACTGAACACC CCCACCTGCT GA

Protein sequence

MKAGRHRSPR PARPMRVPVL LVALIFALAA AFSLGSSTEK SAPLTSGSSP PPRDTSVGIS 
AVGNVIMGST PELPPDGGRH LFDGVADRLA GDVVLANLDQ ALTDAAASTK CGADSSSCYA 
FRTPPSYARW LRQAGFTVIN LANNHSRDFG DAGLRDTQAA LTAHNLQYTG MPGQITLQDV 
GSVRVAILGF APYHWAQSLL DIPAAQQMVR QAAAQADLVL VTIHAGAEGA DRGHVPPGTE 
VFLGEDRGDA VAFSHAAIDA GADAVLGAGP HVLRGMEWYR GRLIAYSLGN FLGYETLSHT 
GAQGVGGIVT LQLTPDGSWH SGQLEGTVMV APGVPQIDPD QRARALVQEL SRTDFGACGV 
QLSAAGELNT PTC