Gene SbBS512_E4344 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SbBS512_E4344
Symbol	glnG
ID	6269202
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shigella boydii CDC 3083-94
Kingdom	Bacteria
Replicon accession	NC_010658
Strand	-
Start bp	4058250
End bp	4059659
Gene Length	1410 bp
Protein Length	469 aa
Translation table	11
GC content	57%
IMG OID	641728153
Product	nitrogen regulation protein NR(I)
Protein accession	YP_001882566
Protein GI	187733434
COG category	[T] Signal transduction mechanisms
COG ID	[COG2204] Response regulator containing CheY-like receiver, AAA-type ATPase, and DNA-binding domains
TIGRFAM ID	[TIGR01818] nitrogen regulation protein NR(I)

Plasmid Coverage information

Num covering plasmid clones	39
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAACGAG GGATAGTCTG GGTAGTCGAT GACGATAGTT CCATCCGTTG GGTGCTTGAA 
CGTGCGCTCG CTGGAGCGGG TTTAACCTGT ACGACATTTG AGAACGGCGC GGAAGTACTG 
GAGGCGCTGG CGAGCAAAAC GCCGGATGTG CTGCTTTCAG ATATCCGTAT GCCGGGAATG 
GACGGGCTGG CGCTGCTCAA GCAGATTAAA CAGCGCCATC CAATGCTTCC GGTCATCATT 
ATGACCGCAC ATTCCGATCT GGATGCTGCC GTCAGCGCCT ATCAACAAGG GGCGTTTGAT 
TATCTGCCCA AACCGTTTGA TATCGACGAA GCCGTGGCGC TGGTTGAGCG CGCTATCAGT 
CATTACCAGG AACAGCAGCA GCCGCGTAAT ATTCAGCTTA ACGGCCCAAC GACCGATATC 
ATCGGCGAAG CGCCAGCCAT GCAGGACGTG TTCCGTATTA TCGGTCGGCT TTCGCGTTCT 
TCTATTAGCG TGCTGATTAA CGGCGAATCC GGCACCGGTA AAGAACTGGT CGCTCATGCC 
CTGCATCGCC ACAGTCCGCG CGCCAAAGCG CCGTTTATCG CGCTGAATAT GGCAGCTATC 
CCAAAAGATT TGATCGAATC AGAACTGTTT GGCCACGAGA AAGGCGCGTT TACTGGCGCG 
AATACCATTC GTCAGGGGCG TTTTGAACAG GCCGATGGCG GTACATTATT CCTCGACGAA 
ATTGGTGATA TGCCGCTGGA TGTGCAGACG CGTTTGCTGC GCGTGCTGGC AGACGGTCAG 
TTTTACCGCG TTGGCGGCTA TGCGCCGGTG AAAGTGGATG TGCGGATTAT CGCTGCCACT 
CACCAGAATC TCGAACAGCG AGTGCAGGAA GGTAAGTTCC GTGAGGATCT GTTCCACCGC 
CTAAACGTTA TCCGCGTTCA TCTGCCGCCG CTGCGCGAAC GTCGGGAAGA TATTCCCCGT 
CTGGCGCGCC ATTTTTTACA GGTTGCCGCG CGCGAACTGG GCGTAGAAGC GAAGTTACTG 
CATCCGGAAA CCGAAACTGC TCTGACGCGT CTGGCGTGGC CAGGCAACGT GCGCCAGCTG 
GAAAACACCT GCCGCTGGCT AACGGTGATG GCCGCCGGGC AGGAAGTGTT GATTCAGGAT 
TTGCCCGGCG AACTGTTTGA ATCAACGGTT GCGGAGAGTA CTTCGCAAAT GCAACCGGAC 
AGCTGGGCGA CGCTTCTTGC GCAGTGGGCA GACAGAGCGC TGCGTTCCGG TCATCAAAAT 
CTGCTTTCCG AAGCGCAGCC AGAGCTGGAG CGGACGTTAC TGACGACCGC GTTGCGACAT 
ACGCAGGGGC ATAAACAGGA AGCGGCGCGG CTACTCGGCT GGGGCCGCAA CACCCTGACG 
CGTAAGTTAA AAGAGCTGGG GATGGAGTGA

Protein sequence

MQRGIVWVVD DDSSIRWVLE RALAGAGLTC TTFENGAEVL EALASKTPDV LLSDIRMPGM 
DGLALLKQIK QRHPMLPVII MTAHSDLDAA VSAYQQGAFD YLPKPFDIDE AVALVERAIS 
HYQEQQQPRN IQLNGPTTDI IGEAPAMQDV FRIIGRLSRS SISVLINGES GTGKELVAHA 
LHRHSPRAKA PFIALNMAAI PKDLIESELF GHEKGAFTGA NTIRQGRFEQ ADGGTLFLDE 
IGDMPLDVQT RLLRVLADGQ FYRVGGYAPV KVDVRIIAAT HQNLEQRVQE GKFREDLFHR 
LNVIRVHLPP LRERREDIPR LARHFLQVAA RELGVEAKLL HPETETALTR LAWPGNVRQL 
ENTCRWLTVM AAGQEVLIQD LPGELFESTV AESTSQMQPD SWATLLAQWA DRALRSGHQN 
LLSEAQPELE RTLLTTALRH TQGHKQEAAR LLGWGRNTLT RKLKELGME