Gene Bpro_4849 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Bpro_4849
Symbol
ID	4012461
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Polaromonas sp. JS666
Kingdom	Bacteria
Replicon accession	NC_007948
Strand	+
Start bp	5134656
End bp	5136356
Gene Length	1701 bp
Protein Length	566 aa
Translation table	11
GC content	69%
IMG OID	637944491
Product	NifA subfamily transcriptional regulator
Protein accession	YP_551623
Protein GI	91790671
COG category	[K] Transcription [T] Signal transduction mechanisms
COG ID	[COG3604] Transcriptional regulator containing GAF, AAA-type ATPase, and DNA binding domains
TIGRFAM ID	[TIGR01817] Nif-specific regulatory protein

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.728864
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCACCT CTGCCCGCAC ACCGCCCCCT TCAAGCAAAT CGTCCGCAGA CCCCCAGTGG 
CGCGCGCAGG AGCTGCTGCT GATGAGCGAG GTCATGCGGC TGGTCGGCAA AAGCCTGGCG 
CCCGAGGTGG TGCTGCGGGA AATGCTGCAC CTGATGTCGG AACTGCTGGG GCTGAACCGG 
GGCCGCATTG TGCTGGCCGA TTTTGTCGGC GACATTGCGT TGCAGGGCCT GGCTGATCGC 
AAACCGGCGA CCCGGGCTGC CGGCGCGCCG GCGCCACAAT CGGCCATTCG TTATGCCTAC 
GGCCTGACGC GCGAGGAAAT GGCGCGCGGC CGCTACGGCC CGGGCGAAGG CATCACCGGC 
CGGGTGCTGG CCACGGCGCA GCCCATCATC GTGCAGGACA TCGATGCCGA GCCGCAGTTT 
CTGGCGCGCT CGGTGGCGCG GGCCCAGCTG CCGCCCGACA CCGTGGCCTT CATTGCGCTG 
CCGATCGAGG TCAACCGCGA GGTGATCGGC GTGCTGGCCT GCCACCGCAT CAGGAGCCGC 
GACCGGCAGC TCGCCGACGA TGTGGCGGTG CTGAAAATCC TGGCGACACT GGCCGGCCAG 
CTGCTGCAGC TGCAGGCGCT GGTGGCGGAA AAAACCCGCG CGCTGCAGGC CAAAAACCAG 
CTGCTGACGC GCGCGCTGGA GACCGCCGCC GCCCGCTACG GCATCATCGG CACCTCGCCG 
GCGCTGCTGC AGGCACTTGG CGAACTGGAA CGGGTGTCAG AGGCCACCGC CAGCGTGCTG 
CTGCTGGGCG AGTCGGGCAC CGGCAAGGAG CTGTTTGCGC GCGCGGTGCA CCTGTCCAGC 
CAGCGCCGCG ACCAGCCTTT CATCAAGGTC AATTGCGCGG CGATTCCCGA CACCTTGTTC 
GAGTCGGAAC TGTTCGGCTA CGAGCGCGGC GCCTTCACCG GCGCACAGAA CGCCCGCGCC 
GGCTGGTTCG AGCAGGCCGA CCGCGGCACG ATATTTCTCG ACGAGATTGG CGAAATGCCA 
CTGGCCATGC AGACCAAGCT GCTGCGCACG CTGCAGGAGG GCACCATTGT GCGGCTGGGC 
GGCAAGCGCG AAATCCGCGT GGAAGTGCGC GTGGTGGCGG CCACCAACCG CGACCTGGCG 
CAGGAGGTGC AGCGCGGCAG CTTCCGGCGC GACCTCTTTT ACCGGCTCAA TGTGATTCCG 
ATCCGGCTGC CCTCGCTGCG CGAGCGTCCG CAGGACATTC GCGCGCTGGC CGTGCATTTT 
TTAAGCCGCA TCAACCAGGC CAACCAGCGC AACGTGAGCC TGTCGCCGGC GGCCCTGGCC 
CGGCTGGAGC AGCACCCCTG GCCCGGCAAC ATCCGCGAAC TGGGCAACGT GATCGAACGG 
CTGGTGCTGC TGACCGACAG CGCCATGGTG TCCGCGCCAG AGGTGGAACG TTTTCTGCCG 
CCCGAACAGG AGGATGCTGC AGCAGCGGCC CGCCCGCCCG CGTTGGCCTC CGCCGGCCAA 
GCCCACGCGC CACCCGGTGC GGCGGCTCCC GCCGTGCGCG AGTACCAGCC CGCCCGGTCG 
CACTCGGCCG CGCAATTGCA GCAGGCGCTG CTGGCCCATG GCGGCAACCA GTCGCGCGCC 
GCGCAGGCCC TGGGGCTGAC GGTGCGGCAG TTCTCCTACC GGCTGCGCAA GATGGGCCTG 
CACAATGTCG ACAATTTGTA G

Protein sequence

MATSARTPPP SSKSSADPQW RAQELLLMSE VMRLVGKSLA PEVVLREMLH LMSELLGLNR 
GRIVLADFVG DIALQGLADR KPATRAAGAP APQSAIRYAY GLTREEMARG RYGPGEGITG 
RVLATAQPII VQDIDAEPQF LARSVARAQL PPDTVAFIAL PIEVNREVIG VLACHRIRSR 
DRQLADDVAV LKILATLAGQ LLQLQALVAE KTRALQAKNQ LLTRALETAA ARYGIIGTSP 
ALLQALGELE RVSEATASVL LLGESGTGKE LFARAVHLSS QRRDQPFIKV NCAAIPDTLF 
ESELFGYERG AFTGAQNARA GWFEQADRGT IFLDEIGEMP LAMQTKLLRT LQEGTIVRLG 
GKREIRVEVR VVAATNRDLA QEVQRGSFRR DLFYRLNVIP IRLPSLRERP QDIRALAVHF 
LSRINQANQR NVSLSPAALA RLEQHPWPGN IRELGNVIER LVLLTDSAMV SAPEVERFLP 
PEQEDAAAAA RPPALASAGQ AHAPPGAAAP AVREYQPARS HSAAQLQQAL LAHGGNQSRA 
AQALGLTVRQ FSYRLRKMGL HNVDNL