Gene GSU1003 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GSU1003
Symbol	ntrC
ID	2687478
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sulfurreducens PCA
Kingdom	Bacteria
Replicon accession	NC_002939
Strand	-
Start bp	1082803
End bp	1084248
Gene Length	1446 bp
Protein Length	481 aa
Translation table	11
GC content	59%
IMG OID	637125673
Product	nitrogen regulation protein NR(I)
Protein accession	NP_952057
Protein GI	39996106
COG category	[T] Signal transduction mechanisms
COG ID	[COG2204] Response regulator containing CheY-like receiver, AAA-type ATPase, and DNA-binding domains
TIGRFAM ID	[TIGR01818] nitrogen regulation protein NR(I)

Plasmid Coverage information

Num covering plasmid clones	3
Plasmid unclonability p-value	0.158383
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTACTGA ACCGCATATT GGTTGCCGAT GACGAAGAAA GCATGCGCTG GGTCCTCTCG 
AAGGCCCTGC GCAAAAAGGG ATTCACCGTG GACCTCGCCC GCGACGGAGA GGAAGCCCTG 
CGACTGATCC AGTCCAACGA GTACGACTTG GCCATCCTCG ACATCAAGAT GCCCGGCTTC 
ACCGGGCTGG AATTGCTCGA CAAGGTACGG GAGCTCAAGC ACGATCTCCT CATGGTGATC 
ATGACCGCCG AGGCGAGCAT GAAAAACGCC GTGGAGGCCA TGAAGCGGGG GGCCTACGAT 
TACATCACCA AGCCCTTCGA CCTGGATGTA ATCGATGCCA TCATCGAAAA GGTGCACAAG 
GCCCGGGAGA TCACCTCCCA AATGACTATT CTGCGGGAAG AGCTGAAAGA GCGCTATCAC 
CTGGAGAAGA ACATCATCGG CAACTCCCCC GCCATGCGGG AAGTCTACAA GACCATCGGC 
AAGGTTGCCC CCAGCGACGT GACCGTTCTC GTTCAGGGGG AGTCAGGGAC CGGCAAAGAG 
CTCATCGCCC GGGCTATTCA CTTCAACTCC AAGCGGATCG GCAAGCCGTT CATCGCCCTC 
AACTGCGCCG CCATTCCCAA AGATTTGCTG GAAAGCGAAC TCTTCGGCTT CGAAAAGGGG 
GCGTTCACCG GCGCCGTCGA GCGCAAGCTG GGCAAGTTTG AGCAGGCCAA CGGCGGCACC 
ATCTTCCTTG ACGAGATCGG CGACATGCCC CTCGATCTCC AGGCAAAAAT CCTGCGGGTG 
CTCCAGGAGA AGGAAGTTAC CCGCACCGGC GGCAGCCAGA ACATCGCCGT GGACGTACGG 
ATCGTGGCAG CCACCAACCA GAACCTGGAG GAACTGGTCC GCAAGAAGCA GTTCCGGGAG 
GATCTCTTCT ACCGGCTCAA CGTGGTGCCT ATTCAGCTGG TACCGCTGAG GGAGCGTAAG 
GAAGACGTGC CGCTTCTGGT GGACTATTTC CTCCAAAACG CCTGCGCGGA ACTGGAGGTT 
TCGCCAAAAA AATGCTCTCC CGAGGCCATG GCGCTCCTCA CCACCCACAG CTGGCCGGGC 
AACGTACGGG AACTGGAGAA TACCATCAAG CGGGCGGTGA TCCTCTCGTC CGACCCGCTT 
CTCACCCCAT CCGACTTTCC GGGGCTGCGT GCCCGCCAGA CGGGAAGCGA GGCGACCGCT 
GCGGACGACC TCTCCCTGGA AGCCCTGGTG GACATGAAAC TGCGGGCAAG CCTCACCAAC 
CTGGACAAAA TGGAGAGCGG GGATATCTAT AACCTGGTCC TCAAGCAGAT CGAGCGGCCT 
CTCATCCGCT TCGTCCTGGA AAAGACGCGT GGCAACCAGG TGAAAGGAGC TGAGATCCTC 
GGCATTAACC GCAACACGCT ACGCAAGAAG ATTCAGGAGC TGGGCATCGA ACTGAGAAAA 
GACTGA

Protein sequence

MLLNRILVAD DEESMRWVLS KALRKKGFTV DLARDGEEAL RLIQSNEYDL AILDIKMPGF 
TGLELLDKVR ELKHDLLMVI MTAEASMKNA VEAMKRGAYD YITKPFDLDV IDAIIEKVHK 
AREITSQMTI LREELKERYH LEKNIIGNSP AMREVYKTIG KVAPSDVTVL VQGESGTGKE 
LIARAIHFNS KRIGKPFIAL NCAAIPKDLL ESELFGFEKG AFTGAVERKL GKFEQANGGT 
IFLDEIGDMP LDLQAKILRV LQEKEVTRTG GSQNIAVDVR IVAATNQNLE ELVRKKQFRE 
DLFYRLNVVP IQLVPLRERK EDVPLLVDYF LQNACAELEV SPKKCSPEAM ALLTTHSWPG 
NVRELENTIK RAVILSSDPL LTPSDFPGLR ARQTGSEATA ADDLSLEALV DMKLRASLTN 
LDKMESGDIY NLVLKQIERP LIRFVLEKTR GNQVKGAEIL GINRNTLRKK IQELGIELRK 
D