Gene Gura_2022 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gura_2022
Symbol
ID	5166151
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter uraniireducens Rf4
Kingdom	Bacteria
Replicon accession	NC_009483
Strand	+
Start bp	2357088
End bp	2359139
Gene Length	2052 bp
Protein Length	683 aa
Translation table	11
GC content	61%
IMG OID	640549516
Product	fibronectin, type III domain-containing protein
Protein accession	YP_001230785
Protein GI	148264079
COG category	[R] General function prediction only
COG ID	[COG3401] Fibronectin type 3 domain-containing protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.00638663
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGAGAAC AGATTAAAAG AACGTTCGCC GGCATCACCG TACTCTGTCT TGTTGCCGTC 
GGTCTTATGC TGACCGGCTG CGGCAGCAGC GGCGGAGGTC TTTCATCCCA GGTCGTGAGT 
GGCGTTGCTG CGGTCGGCGC TCCACTTGCC GGGCAGGTAA ACCTTAAGGA CGCCTCTAAC 
CCTCCACAGG AAAAGTCGAC CGTTATCGGT AATGACGGTA CGTTTGCCTT CGATGTCACG 
GGCATGAAAG GCCCGTTCAT CCTGCAGGCG TCAGGGCGCG CCAACGGAAC GAATTACGCG 
CTTCATTCCT TTGCCGGCGG AACGGGCACA GCCAACGTCA ACCCGCTCTC AAATGCGGCG 
GTAGCCAGTG CTGCAGGGGT TGACGACCCG TCACAGGTCT TCGCGAATCC CGACCCGGTC 
ACGCTCCAGA AAATCGAGTC CAATCTCCAG ACAGCTGTCG CCACTATCCT GTCCAAGCTC 
CACCCGCTCC TGAAGCAGTA CAGCGCAGAC AACTCCGATC CGATCAAGGG GCACTACACC 
GTTGACCACA CCGGTCTCGA CGGCATGCTG GACAATGTGA AAATGACCCT ATCCAACGGG 
GTTCTTACGA TAGTGAATGC GAAAACCGGC GCAGTCATTT TCAGCGGCAA GATCTCCGAC 
ATCAATAACT GGAATTTTTC GGACGACGAT AATAACATTC CCGCCCCGCC TGCCGTGCCC 
GCCGCTCCAG CCGGCTTGAC CGCCACCGGC GCTGCCGGCC AGATGACCCT TTCCTGGAAC 
GCCGTCAGCA ACGCGACCTC GTACAATGTC TACTACTCGA CCACTGGCGG TGTCTCTGCC 
GCCAATGGGA CAAAGATCGC CGGGGCCACC AGTCCTTATG TCCAGAGCGG CCTTACCGCA 
GGAACCACCT ATTACTACAT CGTTACGGCA GTGAACAGCG CCGGCGAAAG CGCTGCCTCG 
GCCCAGGTTT CGGCGACCAC CAATGCGACG CCGACACCGA CGCCGACTCT CCCTGCTGCA 
CCGACCGGAG TAATGGCCAC AGGCGGCACC AACCAGGTGA CCCTCTCCTG GAGCGCCGTC 
AGCAATGCTG CCTCGTACAA CATTTACTGG TCGACCAAGA CAGGCGTCAC GACGAGCAAC 
GGGACAAAGA TCAGCGGTGC CATGAGTCCT GCGGTTCAGG CGGGGCTTGC TGCCGGCACG 
ACCTATTACT ACATCGTTAC GGCAGTGAAC AGCGCAGGCG AGAGCACGCC TTCCGTCCAG 
GTTGCGGCGA CCACCGTCAC TCCGACTCCC GCTCCGACCG TGCCGGCTGC CCCGTCCGGC 
GTGACCGCCA CCGGCGGCGC CAAGCAGGTG ACGCTGTCCT GGCCGGCAGT ATCCGGCGCA 
ACCTCCTATA ATGTCTACTG GTCTACCGCT TCCGGCGTAA CGACCGCGAA CGGCACGAGA 
ATCGCCGGGG CCACCAGCCC TTATGTTCAT ACCGGTCTTT CCGCAGGGAC CAGCTACTAT 
TACATAGTCA CGGCTGTAAA CGGCGCGGGC GAGAGTGCTC CATCAACTCA GGCGACCGCA 
ACCACCAATG CCCCACTTCC GGCCGTTCCT GCTGCACCGA CCGGTGTGAC CGCCACAGGC 
GGCGCCAATC AGGTGTCTCT CTCCTGGTCG GCGGTCTCCG GCGCGACATC GTATAACGTT 
TACTGGTCTA CGACTTCAGG GGTTACGACC GCTTCCGGGA CAAAAATCGC CGGGGCCACC 
AGTCCCTACG TCCAGACCGG GCTTGCCGCC GGCACCGCCT ACTACTACAT CGTAACGGCG 
GTGAACAGCG CCGGTGAGAG CGCCGCGTCG GCAAAGACCA CAGCGACTAC CGCCGCCCCT 
GCAATCGACG GTGCAGCGCT TTATTCACAG TACTGCGCCG GGTGTCACGG AGCCCTGGCA 
TCGTCCAACA AGAGGAAAAC GACCGCTTCC AAGATCCAGT CGGGGATCAG CGGCAATGTC 
GGCGGAATGG GATATCTTTC CTCCCTCTCG GCGGCACAAA TTCAGGCCAT TGCTACGGCT 
TTGAATTTCT AG

Protein sequence

MREQIKRTFA GITVLCLVAV GLMLTGCGSS GGGLSSQVVS GVAAVGAPLA GQVNLKDASN 
PPQEKSTVIG NDGTFAFDVT GMKGPFILQA SGRANGTNYA LHSFAGGTGT ANVNPLSNAA 
VASAAGVDDP SQVFANPDPV TLQKIESNLQ TAVATILSKL HPLLKQYSAD NSDPIKGHYT 
VDHTGLDGML DNVKMTLSNG VLTIVNAKTG AVIFSGKISD INNWNFSDDD NNIPAPPAVP 
AAPAGLTATG AAGQMTLSWN AVSNATSYNV YYSTTGGVSA ANGTKIAGAT SPYVQSGLTA 
GTTYYYIVTA VNSAGESAAS AQVSATTNAT PTPTPTLPAA PTGVMATGGT NQVTLSWSAV 
SNAASYNIYW STKTGVTTSN GTKISGAMSP AVQAGLAAGT TYYYIVTAVN SAGESTPSVQ 
VAATTVTPTP APTVPAAPSG VTATGGAKQV TLSWPAVSGA TSYNVYWSTA SGVTTANGTR 
IAGATSPYVH TGLSAGTSYY YIVTAVNGAG ESAPSTQATA TTNAPLPAVP AAPTGVTATG 
GANQVSLSWS AVSGATSYNV YWSTTSGVTT ASGTKIAGAT SPYVQTGLAA GTAYYYIVTA 
VNSAGESAAS AKTTATTAAP AIDGAALYSQ YCAGCHGALA SSNKRKTTAS KIQSGISGNV 
GGMGYLSSLS AAQIQAIATA LNF