Gene Gbro_0042 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gbro_0042
Symbol
ID	8549369
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Gordonia bronchialis DSM 43247
Kingdom	Bacteria
Replicon accession	NC_013441
Strand	+
Start bp	52016
End bp	53803
Gene Length	1788 bp
Protein Length	595 aa
Translation table	11
GC content	62%
IMG OID
Product	hypothetical protein
Protein accession	YP_003271293
Protein GI	262200085
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTATTC ATCCCAGCAT CAACCACTCT GAAGTCCACA CCAGCGACAG GATCTTCACT 
CAAGCAGTGG TCGTCGTGAA CCGCTCCGGT GCCGCAGCGA TGATCGAGGC GTGGCGAGCC 
GAGAGCGTGG CCGCACCCCG CGGACCGTTC CGAGGGGCCC TGTCCTACAC AGTCGAAAGC 
GTCCTCGTCG CCCTTGCCTG CGTGCTGCTC AGACGAGCCG AACCTACGGT CCGCACGATT 
TTCCGCACCC TGCTCGACTT CACCCCTGAC CAGCTTGCCC AGCTCGACAT CGCCGACGCC 
GATCTCACCG CCATCAGGTC CGATGCTGAC CGAGCCTTGA AAAGCTTCAG GAACCGGCTT 
GATCGAACAC TGGCCTGCCT GGACTCGGCA CGCGATCAGC CCGCAGTACG AATTCCCGTC 
GCCCAGCACA AGGCGATCAT CCGAGCCCGA ACCCCTGAGC AACAAGAAGC ATACGCGATA 
GCGGCGCAAC GACTCTCGAC TGTCGTCAAT CGCATTCTGG CCGGCTCGAT TCCCACCGAA 
TACCAACAAA GCGGCCGCGG CGATGTCGTC GTCGACGAGA CCATCATCGA CACGTCAGAT 
GGGACCTACG ACCTTGGCGT CACCGACGAC CGCAACCGGT CGGCCATCTA CTTCGGTGGC 
TACTACCGAA GGGACTATCG CAATCGCGTC GACGCCGAGG GGAATCCGCT GACGAAGAAA 
CGGGCGTGGG GAATCGGTGT CACGGCGGTC AGCAGTGTCG GGCCGCCCGA TGCCTTGCAT 
AACCGGCCGA TCCTGTTCAC CGGCATAGCT ATTCACCCAC CGACGTCGGG ATCACTCGAA 
GGGCTCGACG AAGCCATCGA GCATCATCAA CGCAACGGGT TCGACAGTCG ATCCGCAAGC 
CGAACCGCCA GATGGCCGCT GATCACCTTC GACATGGGCT ATTTGAAAGA CGGCCTCGAT 
CGATGGCAAT TTGATCGCAA ATATGCTGGC GTCTTCCGCT ATCCCGACCA CTGGCGACGC 
GACTTCGAGA GCGTTCCCGC CCAGCCCGGC GGCGCCAAAC CGGGACCCGT CCAACTTTCG 
GGTGCTTGGT ACTGCCCGAC AGCTGCCGGC ATCTCCCTGG GCAAGAACTA CGTCAAGCCC 
TTGCGCGACG TGCTCAATAA GGACGAATGG GAAGCTCGCG AACGCCGACT TCGTCAGCTC 
CTGCCACGGC TGATGGGGGT CGACAGACGA CTGCTTGAAC GCAATACTCG ACCAGGCCGC 
CCCGCCGAAG GTACTCAGCC TGCTAAATCC GTCAAGCTGG TGCTGACCTG CCCGGCAAGC 
ATCGGCAACG TGAGATGCGC GAGGTGGCAC AACGCCGAGA CCGAGGACCG GCTCGACCTG 
CCCTACATCG AACCCGAGCC CGACATGCCG TACTTCCCGT GTTGCACACA GCGCAGCGTC 
ACAATCACGC TGACCGACGA CCAACGAAAG CGTCAACAGC TCAGTCAGTG GGCACCCGGA 
TCCAACGACC ACGCGATCTA CCACGAGGCT GCCCGCGCGC TCACCGAGCA ACGCTTCAAT 
CTGATCAAAT CGCGGACAGT CGCCGGCCTG GTCCATCTCA AGTACGGGCC GCGCCGCGAA 
CCGCTGGTCA AGCTCATCAT CGCGATGGCG TTCGCCGTCG TGAACGTTCG CGAGATCGAG 
CGATTCGAAT CGTCAAACCG TGACCTCCCC GAATCAATCG CCGCGAAATG GCGCCGACTC 
GAAGCGGACC TCGGACAGCC GCCGATCCGA ATGCCCAACC GCACATGA

Protein sequence

MSIHPSINHS EVHTSDRIFT QAVVVVNRSG AAAMIEAWRA ESVAAPRGPF RGALSYTVES 
VLVALACVLL RRAEPTVRTI FRTLLDFTPD QLAQLDIADA DLTAIRSDAD RALKSFRNRL 
DRTLACLDSA RDQPAVRIPV AQHKAIIRAR TPEQQEAYAI AAQRLSTVVN RILAGSIPTE 
YQQSGRGDVV VDETIIDTSD GTYDLGVTDD RNRSAIYFGG YYRRDYRNRV DAEGNPLTKK 
RAWGIGVTAV SSVGPPDALH NRPILFTGIA IHPPTSGSLE GLDEAIEHHQ RNGFDSRSAS 
RTARWPLITF DMGYLKDGLD RWQFDRKYAG VFRYPDHWRR DFESVPAQPG GAKPGPVQLS 
GAWYCPTAAG ISLGKNYVKP LRDVLNKDEW EARERRLRQL LPRLMGVDRR LLERNTRPGR 
PAEGTQPAKS VKLVLTCPAS IGNVRCARWH NAETEDRLDL PYIEPEPDMP YFPCCTQRSV 
TITLTDDQRK RQQLSQWAPG SNDHAIYHEA ARALTEQRFN LIKSRTVAGL VHLKYGPRRE 
PLVKLIIAMA FAVVNVREIE RFESSNRDLP ESIAAKWRRL EADLGQPPIR MPNRT